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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 幸 出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 吴 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ;而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 省 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 我 们 就 
将 工作 重点 放 在 了 遂 选 、 移 译 国 外 优秀 教材 上。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ,从 他 们 现 有 的 数 百 种 教材 中 王选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brain W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey 
D. Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 
学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书 ”已 经 出 版 了 近 
两 百 个 品种 ,这些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ,我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢 迎 老 师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 

电子 邮件 :hzjsj@hzbook.com 

联系 电话 : (010) 88379604 
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计算 机 改变 并 持续 改变 着 世界 ， 如 今 ， 计 算 技 术 已 把 人 们 带 进 了 云 ait. WD 
联网 ) A “社会 计算 )、 海 “海量 数据 、 大 数据 ) 的 新 时 代 。 

在 变革 的 时 代 里 ， 计 算 机 系统 也 改变 着 自己 ， 在 进步 和 进化 中 遵循 了 一 组 潜 规 则 一 一 
计算 理论 ， 这 套 理论 描述 和 论证 了 计算 机 的 能 与 不 能 ， 界 定 了 计算 能 力 的 极限 。 

业内 人 士 常 评说 某 人 为 某 问题 设计 了 一 个 比较 快 的 算法 ， 好 到 什么 程度 ? 用 专业 术语 
描述 ， 线 性 时 间 内 能 完成 的 比较 快 ， 多 项 式 时 间 能 完成 的 次 之 ， 不 能 在 多 项 式 时 间 内 完成 
的 就 是 不 现实 的 。 但 是 ， 大 数据 时 代 的 来 临 修正 了 这 一 观念 ， 对 于 大 数据 问题 ， 线 性 时 间 
也 嫌 太 长 ， 因 为 需要 “等 它 一 千年 ”， 人 们 呼唤 亚 线性 、 亚 亚 线性 的 算法 。 

有 些 问 题 ， 人 们 已 经 找到 快 的 算法 :有些 问题 ， 还 没有 找到 快 的 算法 ， 也 许 是 等 一 个 
聪明 程序 员 的 出 现 。 但 有 一 类 问题 ， 没 有 找到 好 算法 不 是 因为 人 们 不 够 聪明 ， 而 是 根本 就 
不 存在 这 样 的 算法 。 

计算 理论 将 描述 算法 的 本 质 ， 揭 示 计 算 机 算法 的 能 与 不 能 、 快 与 慢 以 及 足够 快 的 近似 
技巧 。 从 这 个 角度 来 看 ， 计 算 理 论 是 计算 机 的 灵魂 ， 是 应 用 计算 机 成 功 解决 实际 问题 的 
保障 。 

这 本 由 麻 省 理工 学 院 名 师 Michael Sipser 编撰 的 名 著 是 计算 理论 领域 的 优秀 书籍 之 一 ， 
对 于 非 纯 理论 专业 的 人 士 ， 也 许 是 深浅 程度 最 合适 的 。 自 1996 年 第 1 版 问世 ， 该 书 历经 
近 二 十 年 ， 获 得 了 学 术 界 的 公认 和 教育 界 的 好 评 。 该 书 具 有 如 下 优点 : 

第 一 ， 内 容 丰 富 ， 编 排 合 理 ， 展 现 了 计算 机 科学 研究 的 广度 和 深度 。 该 书 以 理论 计算 
机 科学 的 知识 框架 为 脉络 ， 系 统 地 讲述 了 自动 机 与 形式 语言 、 可 计算 性 理论 和 计算 复杂 性 
理论 等 计算 理论 的 重要 内 容 。 总 体 编排 上 ， 难 度 由 浅 入 深 、 循序渐进 ， 易 于 学 习 。 

第 二 ， 文 字 清 晰 ， 语 言 生 动 。 作 者 以 引导 、 举 例 为 叙述 手段 ， 对 计算 理论 领域 的 重要 
定理 、 性 质 等 不 仅 给 出 证 明 ， 而 且 讲 述 证 明 思 路 ， 着 力 让 读者 在 学 习 理 论 的 同时 掌握 证 明 
的 技巧 ， 彰 显 了 作者 在 此 领域 的 深厚 造 证 和 娴熟 的 教学 手法 。 

第 三 ， 各 章 设 有 练习 和 问题 ， 并 提供 了 部 分 习题 的 解答 。 通 过 作答 习题 ， 能 够 锻炼 读 
者 的 逻辑 推导 思维 ， 加 深 读 者 对 关键 知识 点 的 理解 。 

我 以 切身 体会 向 计算 机 专业 的 高 年 级 本 科 生 、 硕 士 生 和 博士 生 推 荐 此 书 。 我 在 本 科 阶 
段 第 一 次 接触 了 该 书 的 第 1 版 。 差 不 多 10 年 前 ， 在 刚 开始 博士 阶段 学 习 时 ， 参 与 了 本 书 
第 2 版 的 翻译 工作 。 如 今 ， 我 又 引导 我 的 学 生 学 习 这 本 书 ， 并 承担 了 第 3 版 的 翻译 工作 。 
作为 多 重 身份 的 “过 来 人 ”， 我 有 独特 的 体会 。 一 方面 ， 该 书写 作 规范 ， 研 究 生 可 以 学 习 
到 规范 的 定义 、 性 质 、 证 明 的 表述 方式 ， 学 习 该 书 内 容 有 助 于 提升 计算 理论 素养 ， 增 强 学 
JHA; 另 一 方面 ， 研 究 生 多 苦于 论文 理论 深度 不 够 ， 也 不 知 如 何 分 析 问 题 ， 认 真 领会 该 
书 讲述 的 证 明 思路 和 人 解 题 思 路 ， 常 会 让 我 们 有 种 然 开 姑 之 感 ， 问 题 分 析 能 力 随 之 增强 ， 进 
而 提高 研究 论文 的 水 平 。 

相 较 于 本 书 第 2 版 ,第 3 版 的 内 容 更 新 主要 在 于 增加 了 关于 确定 型 上 下 文 无 关 语 言 


阐述 ， 这 使 得 本 书 关 于 自动 机 理论 和 语言 处 理 的 介绍 更 为 完整 。 此 外 ， 第 3 版 对 每 章 后 的 
习题 进行 了 增补 和 重新 编排 。 除 了 对 第 3 版 新 增 和 修正 内 容 进行 翻译 以 外 ， 我 们 还 对 第 2 
版 译文 的 错误 进行 了 更 正 。 同 时 ， 我 们 尽 可 能 保持 新 版 译文 的 文风 与 第 2 版 译文 一 致 。 
KRHA, MERER, EX, ERT, Aii, ES Ih T RFK. A 
同 我 们 在 完成 本 书 第 2 版 翻译 工作 时 所 言 ， 本 书 第 3 版 的 翻译 工作 是 在 先行 者 们 工作 的 基 
础 上 ， 再 次 接 过 接力 棒 ， 把 接力 赛 再 推进 一 程 。 借 此 机 会 ， 回 本 书 第 1 版 译 者 (北京 大 学 
的 张 立 昂 教授 、 王 捍 贫 教授 和 黄 雄 老师 ) 表示 衷心 的 感谢 ,也 向 本 书 第 2 版 译 者 表示 衷心 
的 感谢 。 同 时 ， 华 章 公 司 的 姚 蓄 、 朱 动 编辑 在 翻译 过 程 中 给 予 了 我 们 大 力 支 持 ， 回 她们 表 
示 衷 心 的 感谢 。 特 别 回 阅读 本 书 第 2 版 译文 并 给 予 我 们 翻译 指正 的 读者 表示 衷心 的 感谢 。 
由 于 水 平 有 限 ， 译 文 难免 有 错误 和 不 妥 之 处 ， 奶 请 读者 批评 指正 。 


段 & 
2015 年 6 月 于 四 川 大 学 
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本 版 新 增 了 关于 确定 型 上 下 文 无 关 语 言 的 一 节 。 我 选择 这 个 主题 有 以 下 几 个 原因 。 首 
先 ， 它 填补 了 我 之 前 对 自动 机 理论 和 语言 处 理 之 间 的 明显 空白 。 以 前 的 版 本 介绍 了 有 人 穷 目 
动机 以 及 图 灵机 在 确定 型 和 非 确 定型 上 的 变形 ， 但 却 只 包含 了 下 推 目 动机 的 非 确 定型 变 
形 。 因 此 ， 增 加 关于 确定 型 下 推 自 动机 的 讨论 正如 同 找到 完成 拼图 游戏 所 缺 的 那 块 。 

其 次 ， 确 定型 上 下 文 无 关 文 法 理论 是 LR(k) 文法 的 基础 ， 同 时 也 是 自动 机 理论 在 编 
程 语 言 和 编译 器 设计 上 重要 且 非 平凡 应 用 的 基础 。 这 个 应 用 将 一 些 关 键 概念 ， 包 括 确定 型 
和 非 确 定型 有 穷 自 动机 的 等 价 性 、 上 下 文 无 关 文法 和 下 推 目 动机 之 间 的 相互 转换 ， 汇 聚 一 
起 得 到 一 个 高 效 且 漂亮 的 语法 分 析 方 法 。 这 里 我 们 实现 了 理论 和 实践 的 相互 联系 。 

最 后 ， 虽 然 该 主题 作为 自动 机 理论 一 个 真实 的 应 用 非常 重要 ， 但 它 在 现 有 理论 教 
科 书 中 却 没有 得 到 足够 重视 。 我 研究 LR(k) 文法 多 年 但 一 直 没 有 完整 理解 它们 如 何 
工作 ， 也 没有 看 到 它们 与 确定 型 上 下 文 无 关 语 言 理论 的 完美 契合 。 我 写作 这 一 节 旨 在 
为 理论 学 者 和 实践 者 提供 关于 这 个 领域 直观 而 不 失 严 谨 的 介绍 ， 并 由 此 对 该 领域 做 出 
贡献 。 需 要 注意 的 是 : 这 一 节 的 部 分 内 容 非 常 具 有 挑战 性 ， 因 此 基础 理论 课程 的 教师 
可 考虑 将 其 作为 补充 读物 。 之 后 的 章节 不 依赖 于 这 部 分 内 容 。 

在 撰写 本 版 的 过 程 中 ,很 多 人 给 了 我 直接 或 间接 的 帮助 。 我 很 感激 两 位 审阅 者 
Christos Kapoutsis 和 Cem Say。 他 们 阅读 了 这 一 版 新 内 容 的 初稿 ， 并 提供 了 很 有 价值 
的 反馈 意见 。 在 Cengage Learning 的 一 些 人 协助 了 本 书 的 出 版 工作 ， 特 别 是 Alyssa 
Pratt 和 Jennifer Feltri-George。 Suzanne Huizenga 编辑 了 文字 ，ByteGraphics 的 Laura 
Segel 绘制 了 新 的 图 片 并 修改 了 以 前 版 本 中 的 图 片 。 

感谢 我 在 MIT 的 助教 : Victor Chen, Andy Drucker, Michael Forbes, Elena Grigor- 
escu, Brendan Juba, Christos Kapoutsis, Jon Kelner, Swastik Kopparty, Kevin Matulef, 
Amanda Redlich, Zack Remscrim, Ben Rossman, Shubhangi Saraf, Oren Weimann。 他 们 
都 给 予 了 我 帮助 ， 包 括 : 讨论 新 的 问题 并 给 出 解决 方法 ， 提 出 如 何 让 学 生理 解 课 程 内 容 的 
见解 。 我 非常 享受 与 这 群 有 天 典 、 有 热情 的 年 轻 人 一 起 工作 。 

我 很 高 兴 收 到 了 来 自 世 界 各 地 的 邮件 ， 非 常 感谢 你 们 的 建议 、 问 题 和 思路 。 这 里 有 一 
个 相关 人 员 列 表 ， 他 们 的 意见 对 这 个 版 本 产生 了 影 啊 : 

Djihed Afifi, Steve Aldrich, Eirik Bakke, Suzanne Balik, Victor Bandur, Paul Beame, 
Elazar Birnbaum, Goutam Biswas, Rob Bittner, Marina Blanton, Rodney Bliss, Promita 
Chakraborty, Lewis Collier, Jonathan Deber, Simon Dexter, Matt Diephouse, Peter 
Dillinger, Peter Drake, Zhidian Du, Peter Fejer, Margaret Fleck, Atsushi Fujioka, Vale- 
rio Genovese, Evangelos Georgiadis, Joshua Grochow, Jerry Grossman, Andreas 
Guelzow, Hjalmtyr Hafsteinsson, Arthur Hall III, Cihat Imamoglu, Chinawat Israd- 
isaikul, Kayla Jacobs, ‘Flemming Jensen, Barbara Kaiser, Matthew Kane, Christos 


Kapoutsis, Ali Durlov Khan, Edwin Sze Lun Khoo, Yongwook Kim, Akash Kumar, Elea- 


zar Leal, Zsolt Lengvarszky, Cheng-Chung Li, Xiangdong Liang, Vladimir Lifschitz, Ry- 
an Lortie, Jonathan Low, Nancy Lynch, Alexis Maciel, Kevin Matulef, Nelson Max, 
Hans-Rudolf Metz, Mladen Miksa, Sara Miner More, Rajagopal Nagarajan, Marvin Na- 
kayama, Jonas Nyrup, Gregory Roberts, Ryan Romero, Santhosh Samarthyam, Cem Say, 
Joel Seiferas, John Sieg, Marc Smith, John Steinberger, Nuri Tasdemir, Tamir Tassa, 
Mark Testa, Jesse Tjang, John Trammell, Hiroki Ueda, Jeroen Vaelen, Kurt L. Van 
Etten, Guillermo Vázquez, Phanisekhar Botlaguduru Venkata, Benjamin Bing-Yi Wang, 
Lutz Warnke, David Warren, Thomas Watson, Joseph Wilson, David Wittenberg, Brian 
Wongchaowart, Kishan Yerubandi, Dai Yi, 

最 重要 的 是 ， 我 要 感谢 我 的 家 人 一 一 我 的 妻子 Ina 以 及 我 们 的 孩子 Rachel 和 Aaron, 
时 光 鞋 其 ， 岁 月 如 梭 ， 你 们 的 爱 就 是 一 切 。 


Michael Sipser 
马 萨 诸 塞 州 9 剑桥 
2012 年 4 月 
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大 量 读 者 来 的 电子 邮件 反映 ， 第 1 版 没有 习题 解答 是 一 个 缺陷 。 这 一 版 弥补 了 这 一 缺 
陷 。 每 一 章 现 在 都 增加 了 “习题 选 解 ”小 节 ， 给 出 了 该 章 的 练习 和 问题 中 有 代表 性 题目 的 
答案 。 给 出 了 答案 的 问题 就 不 能 再 作为 有 趣 的 有 挑战 性 的 家 诗作 业 ， 为 弥补 这 一 损失 ， 又 
添加 了 若干 新 间 题 。 教 师 可 以 和 www. course. com 上 所 指定 的 相应 地 区 的 销售 代表 联系 ， 
索取 一 份 教 师 手 册 ， 其 中 包含 了 附加 的 答案 。 

第 2 版 的 国际 版 是 针对 国外 读者 的 。 尽 管 涵盖 了 同样 的 主题 ， 它 和 标准 第 2 版 还 是 有 
所 不 同 ， 并 且 不 是 用 来 蔡 代 标准 第 2 版 的 。 

许多 读者 更 喜欢 学 习 更 多 的 “标准 ”主题 ， 比 如 Myhill-Nerode 定理 和 Rice 定理 。 通 
过 将 这 些 主题 展示 在 给 出 答案 的 问题 中 ， 我 部 分 地 采纳 了 这 些 读者 的 意见 。 没 有 将 My- 
hill-Nerode 定理 放 到 书本 主体 中 是 因为 我 认为 ， 这 门 课程 的 目标 是 初步 介绍 而 非 深入 研究 
有 穷 自 动机 。 有 穷 自动 机 在 这 里 的 角色 是 使 学 生 通 过 研究 计算 的 简单 形式 模型 ， 为 了 解 复 
杂 模 型 莫 定 基础 ， 同 时 为 后 续 的 主题 提供 方便 的 例子 。 当 然 ， 一 些 人 希望 有 更 全 面 的 内 
容 ， 同 时 男 一 些 人 觉得 应 该 略 去 所 有 对 有 穷 自动 机 的 引用 (或 者 至 少 是 依赖 )。 尽 管 Rice 
定理 对 于 不 可 判定 性 的 证 明 是 一 个 有 用 的 “工具 ”， 第 2 版 还 是 没有 将 它 放 到 书本 主体 中 ， 
因为 一 些 学 生 可 能 只 是 机 械 地 使 用 它 而 没有 真正 理解 其 作用 。 换 用 归 约 来 证 明 不 可 判定 
性 ， 可 以 为 学 习 复 杂 性 理论 中 出 现 的 归 约 做 更 好 的 准备 。 

我 很 感谢 我 的 助教 Ilya Baran, Sergi Elizalde, Rui Fan, Jonathan Feldman, Ven- 
katesan Guruswami, Prahladh Harsha, Christos Kapoutsis, Julia Khodor, Adam 
Klivans, Kevin Matulef, Ioana Popescu, April Rasala, Sofya Raskhodnikova 和 Iuliu 
Vasilescu， 他 们 帮助 我 草拟 了 和 若干 新 间 题 及 其 答案 。Ching Law, Edmond Kayi Lee 和 
Zulfikar Ramzan 也 为 给 出 答案 付出 了 努力 。 感 谢 Victor Shoup 提出 了 一 个 简洁 的 方法 ， 
用 于 修整 在 第 1 版 中 出 现在 概率 原始 算法 分 析 中 的 缺陷 。 

感谢 Course Technology 出 版 社 的 编辑 们 的 努力 ， 尤 其 是 Alyssa Pratt 和 Aimee Poiri- 
er。 多 谢 Gerald Eisman, Weizhen Mao, Rupak Majumdar, Chris Umans 和 Christopher 
Wilson 所 做 的 审 校 。 感 谢 Jerry Moore 在 编辑 上 的 出 色 工 作 ， 还 有 ByteGraphics 的 Laura 
Segel (lauras@bytegraphics. com) 精彩 而 又 精确 的 图 表 再 现 。 

我 所 收 到 的 电子 邮件 数量 超 乎 预料 。 收 到 来 自 这 么 多 地 方 的 这 么 多 人 的 来 信 绝 对 是 一 
种 快乐 。 我 会 尽量 回复 并 向 我 未 曾 回复 者 表示 歉意 。 我 在 此 列 出 对 本 书 第 2 版 提供 了 有 益 
的 建议 的 人 ， 同 时 对 所 有 给 我 来 信 的 人 表示 感谢 。 

Luca Aceto, Arash Afkanpour, Rostom Aghanian, Eric Allender, Karun Bakshi, 
Brad Ballinger, Ray Bartkus, Louis Barton, Arnold Beckmann, Mihir Bellare, Kevin 
Trent Bergeson, Matthew Berman, Rajesh Bhatt, Somenath Biswas, Lenore Blum, 
Mauro A. Bonatti, Paul Bondin, Nicholas Bone, Ian Bratt, Gene Browder, Doug Burke, 
Sam Buss, Vladimir Bychkovsky, Bruce Carneal, Soma Chaudhuri, Rong-Jaye Chen, 


Samir Chopra, Benny Chor, John Clausen, Allison Coates, Anne Condon, -Jeffrey Con- 
sidine, John J. Crashell, Claude Crepeau, Shaun Cutts, Susheel M. Daswani, Geoff Da- 
vis, Scott Dexter, Peter Drake, Jeff Edmonds, Yaakov Eisenberg, Kurtcebe Eroglu, 
Georg Essl, Alexander T. Fader, Farzan Fallah, Faith Fich, Joseph E. Fitzgerald, Perry 
Fizzano, David Ford, Jeannie Fromer, Kevin Fu, Atsushi Fujioka, Michel Galley, 
K. Ganesan, Simson Garfinkel, Travis Gebhardt, Peymann Gohari, Ganesh Go- 
palakrishnan, Steven Greenberg, Larry Griffith, Jerry Grossman, Rudolf de Haan, Mi- 
chael Halper, Nick Harvey, Mack Hendricks, Laurie Hiyakumoto, Steve Hockema, 
Michael Hoehle, Shahadat Hossain, Dave Isecke, Ghaith Issa, Raj D. Iyer, Christian 
Jacobi, Thomas Janzen, Mike D.Jones, Max Kanovitch, Aaron Kaufman, Roger 
Khazan, Sarfraz Khurshid, Kevin Killourhy, Seungjoo Kim, Victor Kuncak, Kanata 
Kuroda, Suk Y. Lee, Edward D. Legenski, Li-Wei Lehman, Kong Lei, Zsolt Leng- 
varszky, Jeffrey Levetin, Baekjun Lim, Karen Livescu, Thomas Lasko, Stephen Louie, 
TzerHung Low, Wolfgang Maass, Arash Madani, Michael Manapat, Wojciech 
Marchewka, David M. Martin Jr. , Anders Martinson, Lyle McGeoch, Alberto Medina, 
Kurt Mehlhorn, Nihar Mehta, Albert R. Meyer, Thomas Minka, Mariya Minkova, Dai- 
chi Mizuguchi, G. Allen Morris I|, Damon Mosk-Aoyama, Xiaolong Mou, Paul Muir, 
German Muller, Donald Nelson, Gabriel Nivasch, Mary Obelnicki, Kazuo Ohta, Thom- 
as M. Oleson, Jr. , Curtis Oliver, Owen Ozier, Rene Peralta, Alexander Perlis, Holger 
Petersen, Detlef Plump, Robert Prince, David Pritchard, Bina Reed, Nicholas Riley, 
Ronald Rivest, Robert Robinson, Christi Rockwell, Phil Rogaway, Max Rozenoer, 
John Rupf, Teodor Rus, Larry Ruzzo, Brian Sanders, Cem Say, Kim Schioett, Joel Se- 
iferas, Joao Carlos Setubal, Geoff Lee Seyon, Mark Skandera, Bob Sloan, Geoff Smith, 
Marc L. Smith, Stephen Smith, Alex C.Snoeren, Guy St-Denis, Larry Stockmeyer, 
Radu Stoleru, David Stucki, Hisham M. Sueyllam, Kenneth Tam, Elizabeth Thompson, 
Michel Toulouse, Eric Tria, Chittaranjan Tripathy, Dan Trubow, Hiroki Ueda, Giora 
Unger, Kurt L. Van Etten, Jesir Vargas, Bienvenido Velez-Rivera, Kobus Vos, Alex 
Vrenios, Sven Waibel, Marc Waldman, Tom Whaley, Anthony Widjaja, Sean Wil- 
liams, Joseph N. Wilson, Chris Van Wyk, Guangming Xing, Vee Voon Yee, Cheng 
Yongxi, Neal Young, Timothy Yuen, Kyle Yung, Jinghua Zhang, Lilla Zollei, 

当 我 夜以继日 地 坐 在 我 的 电脑 屏幕 前 时 ， 尤 其 要 感谢 我 的 家 人 Ina, Rachel 和 Aaron 
的 耐心 、 理 解 和 爱 。 


Michael Sipser 
马萨诸塞 州 ， 剑 桥 
2004 年 12 月 
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Bart 


欢迎 使 用 本 书 ! 

将 要 开始 学 习 的 是 重要 而 又 引人入胜 的 课题 ,计算 理论 。 它 包括 计算 机 硬件 、 软 件 以 
及 菏 些 应 用 的 基本 数学 特性 。 这 一 课程 试图 回答 什么 是 不 能 计算 的 ， 什 么 是 能 计算 的 ， 可 
以 算 多 快 ， 要 用 多 少 存储 ， 以 及 采用 什么 计算 模型 等 。 这 些 问 题 与 工程 实践 有 着 紧密 的 联 
系 ， 也 具有 纯 理 论 的 一 面 。 

许多 同学 主动 盼望 学 习 这 门 课程 ， 有 些 同学 可 能 只 是 为 了 完成 计算 机 科学 或 者 计算 机 
工程 的 学 位 必需 的 理论 课程 学 分 一 一 他 们 也 许 认 为 理论 比较 神秘 、 难 学 且 用 处 不 大 。 

通过 学 习 ， 读 者 会 发 现 理 论 既 不 神秘 、 也 不 讨厌 ， 是 好 理解 、 甚 至 是 有 趣 的。 理论 计 
算 机 科学 有 许多 迷人 而 重要 的 思想 ， 同 时 它 也 有 许多 细小 的 、 有 时 甚至 是 乏味 的 细节 ， 这 
些 细节 可 能 令 人 感到 厌倦 。 学 习 任 何 一 门 新 的 课程 都 是 一 件 艰 苦 的 工作 。 但 是 ， 如 果 能 把 
它 适 当地 表述 出 来 ， 学 习 就 会 变 得 容易 和 更 愉快 些 。 本 书 的 一 个 基本 目标 是 让 读者 接触 到 
计算 理论 中 真正 令 人 激动 的 方面 ， 而 不 陷 人 单调 乏味 之 中 。 当 然 ， 对 理论 感 兴趣 的 唯一 途 
径 是 努力 去 学 习 并 擎 握 它 。 

理论 与 实践 是 密切 联系 的 ， 计 算 理 论 为 实际 工作 者 提供 了 在 计算 机 工程 中 使 用 的 理性 
工具 。 要 为 具体 的 应 用 设计 一 个 新 的 程序 设计 语言 吗 ? 本 课程 中 关于 语法 的 内 容 迟 早 是 会 
有 用 的 。 要 进行 字符 串 搜索 和 模式 匹配 吗 ? 不 要 忘 了 有 穷 自动 机 和 正则 表达 式 。 遇 到 了 一 
个 看 来 需要 比 你 能 够 提供 的 计算 机 时 间 还 要 多 的 问题 吗 ? 想 一 想 你 学 过 的 有 关 NP 完全 性 
的 内 容 。 各 种 应 用 领域 ， 如 现代 密码 协议 ， 都 依赖 于 在 这 里 将 要 学 习 的 理论 原则 。 

理论 是 有 意义 的 ， 它 回 读 者 展示 了 计算 机 新 的 、 简 单 的 、 更 加 优美 的 一 面 ， 而 通常 我 
们 把 计算 机 看 作 一 台 复 杂 的 机 器 。 最 好 的 计算 机 设计 和 应 用 出 自 完 美的 构思 。 一 门 理论 课 
程 可 以 提高 审美 意识 ， 帮 助 读者 建立 更 加 优秀 的 系统 。 

理论 是 实践 的 指南 ， 学 习 理 论 能 够 扩展 你 的 思维 。 计 算 机 技术 更 新 很 快 ， 专门 的 技术 
知识 虽然 今天 有 用 ， 但 是 仅仅 在 几 年 内 就 会 变 成 过 时 的 东西 。 而 能 力 具 有 持久 的 价值 ， 课 
程 应 该 注重 培养 思考 能 力 、 清 楚 准 确 的 表达 能 力 、 解 决 问题 的 能 力 以 及 知道 问题 什么 时 候 
还 没有 解决 的 能 力 ， 理 论 能 够 训练 这 些 能 力 。 

除了 实际 的 考虑 ， 几 乎 每 一 位 使 用 计算 机 的 人 都 想 了 解 这 个 神奇 的 创造 ， 它 的 能 力 ， 
以 及 它 的 局 限 性 。 为 了 解答 菜 些 基本 问题 ， 在 过 去 的 30 年 里 ， 一 个 全 新 的 数学 分 支 已 经 
确立 。 这 里 还 有 一 个 重大 问题 没有 解决 : 如 果 给 定 大 的 自然 数 ， 例 如 有 500 位 ， 能 够 在 合 
理 的 时 间 内 把 它 分 解 成 素数 的 乘积 吗 ? 即使 使 用 一 台 超 级 计算 机 ， 现 今 还 没 人 知道 怎样 才 
能 在 宇宙 毁灭 之 前 做 完 这 件 事 ! 因子 分 解 问题 与 现代 密码 系统 中 的 某 些 密码 有 关 。 去 寻找 
一 个 快速 的 因子 分 解 方法 吧 ， 也 许 ， 读 者 会 因此 而 一 举 成 名 ! 


XI 


与 给 教师 


本 书 是 计算 机 学 科 高 年 级 本 科 生 或 研究 生 的 计算 理论 入 门 教材 。 它 涉及 计算 理论 的 数 
学 论述 ， 包 括 叙 述 和 证 明定 理 的 基本 技能 。 作 者 努力 使 本 书 适用 于 那些 缺乏 定理 证 明 的 基 
本 训练 的 学 生 ， 当 然 ， 有 较 多 这 种 经 验 的 学 生 会 学 习 得 更 轻松 。 

强调 清楚 和 生动 是 本 书 叙述 的 一 个 特色 ， 本 课程 对 某 些 低层 次 的 细节 强调 了 直觉 和 
“大 的 轮廓 ”。 例 如 ， 虽 然 在 第 0 章 介绍 了 证 明 的 归纳 法 以 及 其 他 的 数学 预备 知识 ， 但 在 后 
面部 分 它 并 不 是 重点 。 关 于 上 自动 机 的 各 种 构造 方法 的 正确 性 ， 一 般 不 用 归纳 证 明 。 只 要 令 
述 清 楚 ， 这 些 构造 方法 已 经 是 令 人 信服 的 ， 不 需 进一步 论证 。 归 纳 证 明 反 而 可 能 把 学 生 搞 
糊涂 而 不 是 给 人 以 启迪。 归纳 法 是 比较 复杂 的 技术 ， 可 能 还 有 些 神秘 。 对 十 分 明显 的 事情 
用 归纳 法 作 反 复 的 说 明 可 能 会 化 简 为 老 、 违 反 初 衷 ， 使 学 生 认 为 数学 证 明 是 一 种 形式 化 手 
法 ， 而 不 是 教 给 他 们 懂得 什么 是 有 说 服 力 的 证 据 ， 什 么 不 是 有 说 服 力 的 证 据 。 

本 书 第 二 部 分 和 第 三 部 分 没有 采用 伪 码 描述 算法 ， 而 用 了 目 然 语言 描述 。 书 中 没有 花 
很 多 时 间 去 设计 图 灵机 (或 任何 其 他 形式 模型 的 程序 。 现 在 的 学 生 都 有 程序 设计 的 经 
历 ， 觉 得 丘 奇 -图 灵 论 题 是 不 言 自明 的 。 因 此 我 不 去 用 很 长 的 篇 幅 叙 述 用 一 个 模型 模拟 为 
一 个 模型 来 说 明 它 们 的 等 价 性 。 

除 增加 直观 性 和 压缩 某 些 细节 外 ， 本 书 内 容 组 织 符 合计 算 理 论 中 的 典型 标准 。 理 论 工 
作者 将 发 现 ， 素 材 的 选取 、 术 语 以 及 内 容 的 前 后 顺序 都 与 其 他 广泛 使 用 的 教材 一 致 。 只 在 
少数 地 方 ， 当 我 发 现 标 准 的 术语 十 分 模糊 或 会 引起 混淆 时 ， 才 引进 了 新 的 术语 。 例 如 ， 引 
进 名 词 映 射 可 归 约 性 代替 多 一 可 归 约 性 。 

习题 是 学 习 与 数学 相关 的 科学 必 不 可 少 的 环节 。 书 中 的 习题 分 成 两 大 类 ， 练 习 用 来 复 
习 定 义 和 概 念 。 问 题 需要 多 动 些 脑筋 。 带 星 号 的 问题 更 难 一 些 。 本 书 努 力 使 练习 和 问题 令 
人 感 兴 趣 ， 并 有 挑战 性 。 
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本 章 先 概述 了 本 书 中 讲述 的 计算 理论 涉及 的 范围 ， 然 后 学 习 或 者 复习 一 些 后 面 需要 用 
到 的 数学 知识 。 


0.1 自动 机 、 可 计算 性 与 复杂 性 


本 书 重 点 在 计算 理论 的 三 个 传统 的 核心 领域 : 自动 机 、 可 计算 性 和 复杂 性 。 是 什么 将 
这 三 个 领域 联系 在 一 起 的 呢 ? 这 就 是 : 

计算 机 的 基本 能 力 和 局 限 性 是 什么 ? 

要 回答 这 个 问题 应 追溯 到 20 世纪 30 年 代 ， 当 时 的 数理 逻辑 学 家 们 首先 开始 探究 什么 是 计 
算 。 自 那 时 起 ， 计 算 机 技术 的 发 展 显著 地 增强 了 人 们 的 计算 能 力 ， 并 且 把 这 个 问题 从 理论 
王国 带 到 人 们 关心 的 现实 世界 。 

对 这 三 个 领域 (自动 机 、 可 计算 性 和 复杂 性 ) 中 的 任 一 个 领域 ， 人 们 都 会 对 这 个 问题 
做 出 不 同 的 解释 ， 并 且 对 不 同 的 解释 会 有 各 不 相同 的 答案 。 在 本 章 之 后 ， 本 书 就 这 三 个 领 
域 中 的 每 个 领域 分 别 独立 介绍 。 在 此 ， 我们 以 相反 的 顺序 〈 复 杂 性 、 可 计算 性 、 自 动机 ) 
介绍 这 些 领 域 ， 因 为 这 样 能 够 帮助 大 家 更 好 地 理解 本 书 的 内 容 。 


0.1.1 计算 复杂 性 理论 


现实 中 ， 计 算 的 问题 是 多 种 多 样 的 ， 有 的 容易 ， 有 的 困难 。 例 如 ， 排 序 是 一 个 容易 的 
问题 ， 按 升序 排列 一 张 数 字 表 ， 即 使 一 台 小 型 计算 机 也 能 迅速 处 理 100 万 个 数 。 相 对 于 时 
间 表 问题 而 言 ， 比 如 要 制定 某所 大 学 的 课程 表 ， 课 程 表 必须 满足 某 些 合理 的 限制 (比如 不 
能 有 两 个 班 在 同一 时 间 使 用 同一 教室 )。 时 间 表 问题 似乎 比 排序 问题 复杂 得 多 。 如 果 有 
1000 个 班 需 要 排 课 ， 即 使 我 们 使 用 一 台 超级 计算 机 ， 也 可 能 需要 花车 干 世纪 的 时 间 才 能 
制定 出 一 份 最 好 的 课程 表 。 

那么 是 什么 使 得 某 些 问题 很 难 计 算 ， 而 又 使 另 一 些 问 题 容 易 计 算 呢 ? 

这 就 是 复杂 性 理论 的 核心 问题 。 值 得 注意 的 是 ， 尽 管 在 过 去 的 40 多 年 里 对 该 问题 进行 了 
深入 细致 的 研究 ， 但 是 我 们 至 今 仍然 没有 它 的 答案 。 接 下 来 ， 我 们 将 探究 这 个 迷人 的 问题 
以 及 它 的 一 些 分 支 领域 。 

到 目前 为 止 ， 科研 工 作者 发 现 了 一 个 根据 计算 难度 给 问题 分 类 的 完美 体系 ， 这 是 复杂 性 
理论 的 一 个 重要 成 果 。 它 类 似 于 按照 化 学 性 质 给 元 素 分 类 的 周期 表 。 按 照 该 体系 ， 即 使 我 们 
还 不 能 证 明 问 题 是 难 计算 的 ， 但 也 能 够 提出 一 种 给 出 某 些 问题 是 难 计算 的 证 据 的 方法 。 

当面 对 一 个 似乎 很 难 计 算 的 问题 时 ， 往 往 会 有 若干 选择 。 首 先 ， 通 过 弄 清 问 题 困难 的 
根源 ， 我 们 可 能 会 做 某 些 改动 ， 使 问题 变 得 容易 解决 。 其 次 ， 我 们 可 能 会 转 而 去 求 问 题 的 
一 个 并 不 完美 的 解 。 在 某 些 情况 下 ， 寻 找 问 题 的 近似 最 优 解 会 相对 容易 一 些 。 再 者 ， 有 些 
问题 仅仅 在 最 坏 的 情况 下 是 困难 的 ， 而 在 绝 大 多 数 情况 下 是 容易 的 。 就 应 用 而 言 ， 一 个 偶 
尔 运行 得 很 慢 而 通常 运行 得 很 快 的 程序 是 能 够 令 人 满意 的 。 最 后 也 可 以 选择 其 他 计算 类 
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型 ， 如 能 够 加 速 某 些 计算 任务 的 随机 计算 。 

受到 复杂 性 理论 直接 影响 的 一 个 应 用 领域 是 密码 技术 ， 这 是 一 个 古老 的 研究 领域 。 在 
绝 大 多 数 领 域 中 ， 选 择 容易 计算 的 问题 比 选择 难 计算 的 问题 更 可 取 ， 因 为 求解 容易 问题 的 
代价 更 小 。 密 码 技 术 与 众 不 同 ， 它 特别 需要 难 计算 的 问题 ， 而 不 是 容易 计算 的 问题 。 因 为 
在 不 知 密 钥 或 口令 时 ， 密 码 应 该 是 很 难 破解 的 。 复 杂 性 理论 给 密码 研究 人 员 指 出 了 寻找 难 
计算 问题 的 方向 ， 围 绕 这 些 问 题 他 们 已 经 设计 出 新 的 创造 性 的 编码 。 


0. 1.2 可 计算 性 理论 


在 20 世纪 前 半 叶 ， 像 哥 德 尔 (Kurt Gödel), AR (Alan Turing) KEA (Alonzo 
Church) 这 样 的 数学 家 们 ， 发 现 一 些 基 本 问题 是 不 能 用 计算 机 解决 的 。 确 定 一 个 数学 命题 
是 真 或 是 假 就 是 这 样 一 个 例子 。 这 项 任务 是 数学 家 们 的 工作 ， 因 为 它 属 于 数学 王国 的 范 
畴 ， 所 以 用 计算 机 来 解决 似乎 很 自然 。 但 是 ， 没 有 计算 机 算法 能 够 完成 这 项 任务 。 

关于 计算 机 理论 模型 思想 的 发 展 就 是 这 一 具有 深远 意义 的 研究 成 果 之 一 ， 它 最 终 会 帮 
助人 们 制造 出 实用 的 计算 机 。 

可 计算 性 理论 与 复杂 性 理论 是 密切 相关 的 。 在 复杂 性 理论 中 ， 目 标 是 把 问题 分 成 容易 
计算 的 和 难 计算 的 ; 而 在 可 计算 性 理论 中 ， 是 把 问题 分 成 可 解 的 和 不 可 解 的 。 可 计算 性 理 
论 引 入 了 一 些 在 复杂 性 理论 中 使 用 过 的 概念 。 


0.1.3 自动 机 理论 


自动 机 理论 阐述 了 计算 的 数学 模型 的 定义 和 性 质 。 这 些 模型 在 计算 机 科学 的 若干 应 用 
领域 中 起 着 作用 。 一 个 模型 是 有 穷 自动 机 模型 ， 它 用 在 文本 处 理 、 编 译 程序 以 及 硬件 设计 
中 ; 另 一 个 模型 是 上 下 文 无 关 文 法 模型 ， 它 用 在 程序 设计 语言 和 人 工 智能 中 。 

自动 机 理论 是 学 习 计 算 理 论 的 非常 好 的 起 点 。 可 计算 性 理论 和 复杂 性 理论 需要 对 计算 
机 给 出 一 个 准确 的 定义 。 自 动机 理论 让 我 们 在 介绍 与 计算 机 科学 的 其 他 非 理论 领域 有 关 的 
概念 时 可 以 使 用 计算 的 形式 化 定义 。 


0.2 数学 概念 和 术语 


与 任何 数学 科目 一 样 ， 开 始 时 ， 我 们 先 讨论 一 下 预计 要 用 到 的 基本 的 数学 对 象 、 工 具 
和 概念 。 


0.2.1 集合 


集合 (set) 是 一 组 对 象 ， 把 它 看 成 一 个 整体 。 集 合 可 以 包含 任何 类 型 的 对 象 ， 包 括 
数 、 符 号 甚至 其 他 集合 。 集 合 中 的 对 象 称 为 它 的 元 素 (element) 或 成 员 (member), Æ 
合 可 以 用 几 种 方式 形式 化 地 描述 。 一 种 方式 是 在 大 括号 内 列 出 它 的 元 素 。 例 如 ， 集 合 

lS?) 
包含 元 素 7，21 和 57。 符 号 多 和 和 分别 表示 集合 成 员 和 非 集合 成 员 。 如 ，7E{7,21,57)}， 
8F 17,21,57}。 对 于 A 和 B 这 两 个 集合 ， 如 果 A 的 每 个 成 员 也 是 B 的 成 员 ， 则 称 A X B 
的 子 集 (subset), WE ACB. WR A 为 B 的 子 集 旦 不 等 于 B， 则 称 A 为 B 的 真子 集 
(proper subset), WE A ŒB. 
集合 与 描述 它 的 元 素 的 排列 顺序 无 关 ， 也 不 考虑 其 元 素 的 重复 。 (57,7,7,7,21) 和 


{7,21,57} 表示 同一 个 集合 。 如 果 确 实 要 考虑 元 素 出 现 的 次 数 ， 则 把 它 称 作 多 重 集合 
(multiset). MM, {7} 和 (7, 7} 作为 多 重 集 合 是 不 相同 的 两 个 集合 ， 而 作为 集合 是 同 

一 个 集合 。 无 穷 集 合 (infinite set) 是 包含 无 穷 多 个 元 素 的 集合 。 不 可 能 列 出 无 穷 集合 的 
所 有 元 素 ， 所 以 有 时 用 记号 “…” 表 示 “ 集 合 的 元 素 序 列 将 永远 继续 下 去 ”。 因 此 ， 我 们 
把 自然 数 集 (set of natural numbers) N BW 

Oe Pe, 
把 整数 集 (set of integers) Z BN 
ee Mey A Pa en pee 

不 含 任 何 元 素 的 集合 称 作 空 集 (empty set) ， 记 为 外。 通常 ， 若 集合 由 唯一 一 个 元 素 组 成 ， 
则 把 它 称 作 单 元 素 集合 (singleton set); 若 集 合 恰好 只 包含 两 个 不 同 元 素 ， 则 被 称 作 二 元 
集合 (unordered pair), 

当 我 们 描述 由 服从 某 种 规则 的 元 素 组 成 的 集合 时 ， 通 常 写 为 in| AF n 的 规则 }。 例 
WM, (n| 对 于 某 个 mmEN，2 一 m2 }， 它 表示 由 完全 平方 数组 成 的 集合 。 

对 给 定 的 两 个 集合 A 和 B, 把 A 和 B 中 的 所 有 元 素 合 并 为 一 个 大 集合 ， 这 样 得 到 的 
集合 称 为 A 和 B 的 并 集 (union)， 记 为 AUB。 既 在 A 中 又 在 B 中 的 所 有 元 素 组 成 的 集合 
称 为 A AB 的 交集 (intersection)， 记 为 A 门 B。 所 有 需要 考虑 的 、 但 不 在 A 中 的 元 素 组 
成 的 集合 称 为 A 的 补 集 (complement)， 记 为 A。 

数学 中 通常 用 形象 化 的 图 形 来 帮助 阐明 某 个 概念 。 对 于 集合 ， 我 们 采用 所 谓 的 文 氏 图 
(Venn diagram) 来 描述 。 通 常 把 集合 表示 为 圆圈 围 成 的 区 域 。 例 如 ， 在 图 0-1 中， 用 

“以 + 开头” 这 个 图 来 表示 以 字母 “t” 开头 的 英文 单词 组 成 的 集合 。 图 中 的 圆圈 表示 “以 
t 开头 ”的 集合 ， 集 合 的 几 个 元 素 表 示 为 圆 内 的 几 个 点 。 
类 似 地 ， 在 图 0-2 中 的 圆圈 表示 以 字母 “z” 结 尾 的 英文 单词 组 成 的 集合 。 


以 t 开 头 以 z 结 尾 
terrific quartz 
tundra Jazz 
theory razzmatazz 


图 0-1 以 “t” 开 头 的 英文 单词 集合 的 文 氏 图 图 0-2 以 “z” 结 尾 的 英文 单词 集合 的 文 氏 图 

如 果 在 同一 个 文 氏 图 中 表示 两 个 以 上 的 集合 ， 为 了 表明 它们 具有 某 些 共同 的 元 素 ， 应 
该 把 它们 画 成 部 分 重叠 在 一 起 ， 如 图 0- 3 Prax. PMN, Mis] topaz 就 是 在 两 个 集合 中 。 图 
中 还 有 一 个 圆圈 表示 “以 j 开头 ”的 集合 ， 由 于 没有 任何 一 个 单词 同时 在 这 两 个 集合 中 ， 
所 以 它 和 表示 “以 tt 开头 ” HAARE. 

图 0-4 中 的 两 个 文 氏 图 描述 了 集合 A 和 B 的 并 集 和 交集 。 


以 :开头 以 z 开 头 URFA 


T 


topaz jazz (a) AUB (b) ANB 


图 0-3 (Rl AY Bt BB oP He WA A SE TA) OUR 图 0-4 表示 并 集 和 交集 的 文 氏 图 
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0.2.2 序列 和 多 元 组 


序列 (sequence) 是 某 些 元 素 或 成 员 按 某 种 顺序 排 成 的 一 个 列表 。 通 常 把 它 写 在 一 对 

圆 括号 内 指明 它 为 一 个 序列 。 例 如 ， 序 列 7,21,57 可 写 为 

(721,557) 
在 集合 中 可 不 考虑 元 素 的 顺序 ， 但 在 序列 中 要 考虑 元 素 的 顺序 。 因 此 ， (7,21,57) 和 
(57,7,21) 是 两 个 不 同 的 序列 。 类 似 地 ， 在 集合 中 元 素 是 否 重复 无 关 紧 要 ， 而 在 序列 中 元 
素 是 否 重 复 却 很 重要 。 例 如 序列 (7,7,21,57) 与 前 两 个 序列 都 不 相同 ， 而 集合 (7,21, 
57} 与 (7,7,21,57} 是 相同 的 集合 。 

与 集合 一 样 ， 序 列 也 可 以 是 有 穷 序 列 或 者 无 穷 序 列 。 通 常 把 有 穷 序 列 称 为 多 元 组 
(tuple), k 个 元 素 的 序列 称 为 & 元 组 (Atuple)。 例 如 ，(7,21,57) 为 一 个 3 元 组 。2 元 组 
也 称 为 有 序 对 (ordered pair). 

集合 与 序列 可 以 作为 其 他 集合 或 序列 的 元 素 。 例 如 ，A WHE (power set) HAW 
所 有 子 集 的 集合 。 设 A 为 集合 {0,1}， 则 A 的 震 集 为 集合 {名 ,{0},{1},{0,1)}。 元 素 为 
0 和 1 的 所 有 有 序 对 组 成 的 集合 为 {(0,0),(0,1),(1,0),(1,1))。 

设 A 和 吾 为 两 个 集合 ， A 和 吾 的 笛 卡 儿 积 (Cartesian product) 或 叉 积 (cross product) 
为 这 样 一 个 集合 ， 它 是 第 一 个 元 素 为 A 的 元 素 、 第 二 个 元 素 为 B 的 元 素 的 所 有 有 序 对 组 
成 的 集合 ， 记 作 AXB. 

URED 设 A 王 (1,2》 M B={z,y,z}, IW 


AXB=({(1,2),€1,y).€1,2) 5€2,%) 5 (25) (252) } = 
AWA k TEA A, A2, Ar 的 笛 卡 儿 积 ， 记 为 AliXAsX…XAk。 它 是 由 所 有 下 
元 组 (dis Gos “y ap) 组 成 的 集合 ， 其 中 i EAr 


JEES 设 A 和 B 两 个 集合 与 例 0.1 中 的 A、B 相同 ， 则 
AXBXA =la la 
IRORI MEIE ARN e ETP 
ER DIREA MAIRENA N - 
集合 自身 的 笛 卡 儿 积 可 采用 如 下 缩写 形式 : 


AXAX.…xA= A? 


URED aN 等 于 NXN。 它 是 由 所 有 自然 数 的 有 序 对 组 成 的 集合 ， 也 可 以 写 为 
C Gy J) lér Joll m 


0.2.3 函数 和 关系 


WAS ha. KAE O., BBA (unction) 是 一 个 建立 输入 -输出 关系 的 对 象 。 它 得 
到 一 个 输入 ， 产 生 一 个 输出 。 对 于 每 一 个 函数 ， 同 样 的 输入 总 会 产生 同样 的 输出 。 设 是 
一 个 函数 ， 当 输入 值 为 a 时 它 的 输出 值 为 5， 则 记 为 
f(a)=6 
函数 又 称 为 映射 (mapping)， 并 且 ， 若 f(a) 二 6， 则 称 f 把 a 映射 为 5。 
例如 ， 对 绝对 值 阴 数 abs， 取 一 个 数 z 作为 它 的 输入 ， 当 工大 于 等 于 0 时 该 函数 返回 


x; 当 工 小 于 0 时 该 函数 返回 一 +。 因 此 ，abs(2)= 二 abs( 一 2) 二 2。 加 法 是 函数 的 另 一 个 例 
子 ， 记 为 ad&。 加 法 函数 的 输入 是 由 两 个 数组 成 的 有 序 对 ， 输 出 是 这 两 个 数 之 和 。 

肾 数 的 所 有 可 能 的 输入 组 成 的 集合 称 为 函数 的 定义 域 domain). PA% HY Mi h thE A 
于 另 一 个 集合 ， 这 个 集合 称 为 函数 的 值 域 (range) 。 对 于 函数 f， 采 用 如 下 方式 表述 其 定 
SMA D 和 值 域 为 R: 

f:D—R 

an SR BR il HEE BEAN. PR abs 的 定义 域 和 值 域 都 为 Z， 可 以 写 为 abs:Z 一 Z。 对 于 整数 
的 加 法 函数 ， 如 果 定 义 域 为 整数 有 序 对 集合 ZXZ， 而 值 域 为 Z， 则 可 以 写 为 add: ZX 
ZZ。 注 意 : 图 数 不 必 取得 指定 值 域 的 所 有 元 素 。 虽 然 一 1EZ， 但 是 果 数 abs 绝 不 会 取 到 
值 一 1。 如 果 函 数 取得 值 域 的 所 有 元 素 ， 则 称 它 映 上 Conto) 到 这 个 值 域 。 

通常 可 以 用 几 种 方法 描述 一 个 具体 的 函数 。 其 中 一 种 方法 是 采用 从 指定 的 输入 到 输出 
的 计算 过 程 。 而 另 一 种 方法 是 用 一 张 表 列 出 所 有 可 能 的 输入 和 对 应 的 输出 。 

考虑 函数 f;{0,1,2,3,4}-={0,1,2,3,4}。 


n GC 1 2sa 

om 2 3534p 
该 函数 为 把 它 的 输入 加 1， 然 后 输出 再 执行 模 5 后 的 计算 结果 。 通 常 ， 对 于 一 个 数 的 模 
m 的 结果 就 等 于 该 数 除 以 m 后 所 得 到 的 余数 。 例 如 ， 钟 表 表 盘 上 的 分 针 按 模 60 计数 。 
当 作 模 运算 时 ， 记 为 Z 二 {0,1,2,…,m 一 1}。 用 这 个 记号 ， 前 面 提 到 的 函数 f 可 以 写 
为 f ;2 一 25。 wi 
如 果 函 数 的 定义 域 为 两 个 集合 的 笛 卡 儿 积 ， 这 时 需要 使 用 2 维 表格 来 描 


述 。 在 这 里 有 为 一 个 函数 9:Z XZ 一 Zi 。 它 表示 标号 为 i 的 行 和 标号 为 j 的 列 的 内 容 是 
9(i,j) 的 值 。 





PRA 9 HER 4 的 加 法 函数 。 a 

“PRA f NE IMA AL XA Xe XA, 时 ，f 的 输入 是 上 元 组 Cai yaz，… an), Bai 
为 f 的 自 变量 (argument), 个 自 变 量 的 函数 称 为 & 元 函数 (kary function), k KAM 
数 的 元 数 (arity)。 当 上 有 等 于 1 时 ，f 有 一 个 自 变 量 ， 称 为 一 元 函数 《unary function). 4 
& 等 于 2 时 ，j 为 二 元 函数 (binary function) 。 将 某 些 大 家 熟悉 的 二 元 函数 写 为 特殊 的 中 
缀 表示 法 (infix notation) 的 形式 ， 即 把 函数 符号 放 在 它 的 两 个 自 变 量 之 间 ， 而 不 采用 前 
缀 表示 法 (prefix notation) 把 函数 符号 放 在 最 前 面 。 例 如 ， 加 法 函数 add 通常 采用 中 缀 表 
示 法 把 符号 “十 ” 放 在 两 个 自 变量 之 间 ， 写 为 a 十 6。 代 替 采 用 前 缀 表示 法 add(a,b). 

谓词 (predicate) 或 性 质 (property) 是 一 种 函数 ， 它 的 值 域 为 《ITRUE,FALSE }。 
例如 ， 设 even 为 一 个 谓词 ， 当 输入 为 偶数 时 该 函数 的 输出 为 TRUE; 当 输 入 为 奇数 时 该 


函数 的 输出 为 FALSE。 因 而 ，even(4) 二 TRUE, even(5)=FALSE., 

定义 域 为 A* 的 谓词 称 为 关系 (relation), 或 称 为 & 元 关系 (kary relation)， 也 称 为 
AERA 元 关系 。 通 常用 的 是 二 元 关系 (binary relation)。 当 我 们 书写 一 个 包含 二 元 关系 
的 表达 式 时 ， 习 惯 上 采用 中 缀 表示 法 。 例 如 ，“ 小 于 ”是 一 个 关系 ， 通 党 写成 带 中 缀 符号 
“于 ”的 形式 。“ 等 于 ”是 大 家 熟悉 的 男 一 个 关系 ， 写 为 带 中 级 符号 “= 二 ”的 形式 。 设 RR 是 
一 个 二 元 关系 ， 则 命题 aRb 表示 aRb 二 TRUE。 类 似 地 ， 设 R 是 一 个 & 元 关系 ， 则 命题 R 
(alsa2，"… ak ) 表示 R(a) a2 5°**,ax) =TRUE, 

在 一 个 叫 作 剪刀 一 布 一 石头 的 儿童 游戏 中 ， 两 个 人 同时 选择 集合 剪刀， 
Ww, AX) 中 的 任 一 个 元 素 ， 并 且 用 手势 表示 出 来 。 如 果 两 个 人 的 选择 是 相同 的 ， 则 游戏 
重 来 。 如 果 选 择 不 相同 ， 则 按照 下 述 打 败 关系 ， 确 定 一 个 人 获胜 。 





剪刀 FALSE TRUE FALSE 
fi FALSE FALSE TRUE 
石头 TRUE FALSE FALSE 
根据 这 张 表 ， 剪 刀 打 败 布 为 TRUE， 而 布 打 败 剪刀 为 上 ALSE。 z 


有 时 用 集合 代替 函数 来 描述 谓词 更 方便 一 些 。 例 如 ， 谓 词 P: D>{TRUE, FALSE} 
可 以 写成 (D,S)， 其 中 S={a€D|P(a)=TRUE), 或 当 根 据 上 下 文 定 义 域 D 是 明显 的 
时 候 ， 简 单 地 写成 S。 于 是 ， 打 败 关 系 可 以 写 为 如 下 形式 : 

(CHUA) (A Ak) CEA)? 

等 价 关系 (equivalence relation) 是 一 种 特殊 类 型 的 二 元 关系 ， 它 利用 了 通过 某 种 特 
征 把 两 个 对 象 等同 起 来 的 想法 。 如 果 二 元 关系 R 满足 以 下 3 个 条 件 : 

1. R 是 自 反 的 (reflexive)， 即 对 每 一 个 x，ZXxRX。 

2. R 是 对 称 的 (symmetric)， 即 对 每 一 个 x 和 yy，xRy 意味 着 yRo. 

3. R 是 传递 的 (transitive)， 即 对 每 一 个 Xx，y 和 zz，xRy 和 yRz 意味 着 XRz。 

则 称 R 为 一 个 等 价 关 系 。 

URES XL—-TSARARELNSRKA=. Mi, JEN, MRi-j 是 7 的 倍数 ， 
则 说 i 三 7 。 这 是 一 个 等 价 关 系 ， 因 为 它 满足 上 述 的 3 个 条 件 。 首 先 ， 它 是 自 反 的 ， 因 为 i 
—j=0 是 7 的 倍数 。 其 次 ， 它 是 对 称 的 ， 因 为 若 ;一 i 是 7 的 倍数 ， 则 i 一 7 也 是 7 的 倍数 。 
再 者 ， 它 是 传递 的 ， 因 为 只 要 i 一 7 是 7 的 倍数 且 ;一 & 是 7 的 倍数 ， 那 么 i 一 k= 二 (i 一 站 十 
(j 一 k) 是 两 个 7 的 倍数 之 和 ， 从 而 也 是 7 的 倍数 。 a 





0.2.4 图 


无 向 图 (undirected graph) 简称 为 图 (graph), 
是 由 一 个 点 的 集合 以 及 连接 其 中 某 些 点 的 线段 组 成 
的 。 这 些 点 称 为 结 点 (node) 或 顶点 (vertex), 
线段 称 为 边 (edge), A 0- 5 所 示 。 

顶点 的 度 (degree) 是 以 这 个 顶点 为 端点 的 边 
的 数目 。 在 图 0-5 (a) 中 所 有 顶点 的 度 都 为 2。 在 
图 0-5 b 中 所 有 项 点 的 度 都 为 3。 任 何 两 个 顶点 图 0-5 图 的 例子 





之 间 至 多 有 一 条 边 。 在 某 些 情况 下 ， 人 允许 图 中 含有 始点 和 终点 相同 的 边 ， 并 称 其 为 自 环 
(self-loop) 。 

设 图 C 包含 项 点 i 和 顶点 ;， 有 序 对 Gp) 表示 连接 i 和 j 的 边 。 在 无 向 图 中 不 考虑 i 
和 j KIE, AKEEF GD 和 GD 表示 同一 条 边 。 由 于 顶点 的 顺序 是 无 关 紧 要 的 ， 
所 以 有 时 用 二 元 集合 来 表示 无 回 边 ， 写 为 (ij). WR G 的 顶点 集 为 V、 边 集 为 正 ， 则 记 为 
G 一 (V,E) 。 可 以 用 一 个 图 形 或 更 形式 化 地 指定 六 和 五 来 描述 一 个 图 。 人 例如， 图 0- 5(Ca) 中 
图 的 形式 化 描述 为 

和 有 故国 省 王国 二 本 二 全 > 本 六 主人 中 
图 0-5 b 中 图 的 形式 化 描述 为 
Ct Lk Sed be A Ol od C1 4 het) Cd he 

通常 可 用 图 表示 数据 。 例 如 : 顶点 为 城市 、 边 为 连接 城市 的 高 速 公 路 ， 或 者 顶点 为 
人 、 边 为 连接 他 们 的 友情 。 有 时 为 了 方便 ， 给 图 的 顶点 或 边 作 标记 ， 这 样 的 图 称 作 标定 图 
(labeled graph). KI 0-6 画 出 一 张 图 ， 它 的 顶点 为 城市 。 如 果 两 个 城市 之 间 有 直达 航班 ， 
则 它们 之 间 有 一 条 边 ， 并 且 标 上 直达 飞行 的 最 低 票 价 (美元 )。 

如 果 图 G 的 顶点 集 为 图 互 的 顶点 集 的 子 集 ， 则 称 GHH 的 子 图 (subgraph)。 如 图 
0-7 所 示 ，G 的 边 均 为 互 在 对 应 项 点 上 的 边 。 图 0- 7 表示 图 H 和 子 图 C 。 









子 图 C 
KAN ( 粗 黑 线 部 分 ) 
图 0-6 城市 之 间 直 达 飞 行 的 最 低 票 价 图 0-7 图 G ARAR E 五 的 子 图 


图 中 的 路 径 (path) 是 由 边 连接 的 顶点 序列 。 简 单 路 径 (simple path) 是 没有 顶点 重 
复 的 路 径 。 如 果 每 一 对 顶点 之 间 都 有 一 条 路 径 ， 则 称 这 个 图 为 连通 图 (connected graph). 
如 果 一 条 路 径 的 起 点 和 终点 相同 ， 则 称 这 个 图 为 一 个 圈 (cycle)。 如 果 一 个 圈 包 含 至 少 3 
个 顶点 ， 并 且 除 起 点 和 终点 之 外 没有 顶点 重复 ， 则 称 它 是 一 个 简单 圈 (simple cycle). ff 
(tree) 是 连通 且 没 有 人 简单 圈 的 图 ， 如 图 0-8 所 示 。 有 时 专门 指定 树 的 一 个 顶点 ， 把 它 称 为 
这 棵 树 的 根 〈root) 。 一 棵 树 中 度数 为 1 的 顶点 称 为 这 棵 树 的 树叶 deaf). 





图 0-8 (a) 图 中 的 一 条 路 径 ，(b) 图 中 的 一 个 圈 ，(c) 一 棵 树 


在 有 向 图 (directed graph) 中 线段 被 箭头 所 替换 ， 如 图 0-9 所 示 。 从 一 个 顶点 引出 的 
箭头 数 为 这 个 顶点 的 出 度 〈outdegree) ， 指 癌 一 个 顶点 的 
(© 


箭头 数 为 这 个 顶点 的 入 度 (indegree) 。 

在 有 向 图 中 ， 用 有 序 对 (i,;) 表示 从 i 到 j 的 边 。 i © 
有 向 图 G 的 形式 化 描述 为 (V,E)， 其 中 V 为 顶点 集 , E WL 
为 边 集 。 图 0- 9 中 表示 的 有 向 图 的 形式 化 描述 为 B 的 

【由 

LEA RA Abi Eih 图 0-9 “> et (al 

所 有 箭头 的 方向 都 与 其 前 进 的 方 回 一 致 的 路 径 称 为 有 向 路 径 (directed path). MRM 
每 一 个 顶点 到 另 一 个 顶点 都 有 一 条 有 向 路 径 ， 则 称 这 个 有 向 图 为 强 连通 图 (strongly con- 
nected graph) 。 有 向 图 是 描述 二 元 关系 的 便利 方式 。 设 R 为 一 个 二 元 关系 ， 它 的 定义 域 为 
DXD， 则 标定 图 G=(D,E) RAR, HP E=((z,y)|zcRy}. 

表示 例 0.6 中 给 出 的 关系 的 有 向 图 如 图 0- 10 所 示 。 





图 0-10 表示 打败 关系 的 有 向 图 
025 字符 串 和 语言 


字符 串 是 计算 机 科学 的 重要 基础 之 一 。 根 据 应 用 的 要 求 ， 可 以 在 各 种 各 样 的 字母 表 上 
定义 这 样 的 字符 串 。 按 照 要 求 ， 定 义 字 母 表 (alphabet) 为 任意 一 个 非 空 有 穷 集 合 。 字 母 
表 的 成 员 为 该 字母 表 的 符号 (symbol), MHAKE HSE SAT 表示 字母 表 和 字母 表 
中 符号 的 打印 字体 。 下 面 是 几 个 字母 表 的 例子 。 

Zi = {0,1} 
Dobe se rE ht yk ol pts 50s Pod oF 08 tou Bs Yo} 
r=({0,l,z,y,2} 

字母 表 上 的 字符 串 (string over an alphabet) 为 该 字母 表 中 符号 的 有 穷 序 列 ， 通 常 写 
为 一 个 符号 挨 着 一 个 符号 ， 不 用 逗号 隔 开 。 设 丈 =(0,1)， 则 01001 AS, 上 的 一 个 字符 
$., WS2—{a,b,c,°,z} 则 abracadabra 为 32 上 的 一 个 字符 串 。 设 玛 为 三 上 的 一 个 字符 
串 ，w 的 长 度 (length)〉 等 于 它 所 包含 的 符号 数 ， 记 作 | w | 。 长 度 为 零 的 字符 串 叫 作 空 
串 (empty string)， 记 为 <。 空 串 起 的 作用 就 像 0 在 数 系 中 的 作用 一 样 。 如 果 w 的 长 度 为 
n， 则 可 以 写 为 ww 二 wiwz…rwn， 这 里 每 一 个 wE., w 的 反 转 (reverse) 是 按照 相反 的 顺 
序 写 w 所 得 到 的 字符 串 ， 记 作 wR ， 即 wR 二 wnwn-1…rw1l。 如 果 字 符 串 z 连续 地 出 现在 w 
H, ME z 为 w AFR (substring)。 例 如 ，cad 为 abracadabra 的 子 串 。 

设 工 是 长 度 为 m 的 字符 串 ，y 是 长 度 为 ”的 字符 串 ，z Aly 的 连接 (concatenation) 
是 把 y 附加 在 xz 的 后 面 得 到 的 字符 串 ， 记 为 zy， 即 zy 一 zl…znyl…yn。 可 采用 上 标 表 示 
法 表示 一 个 字符 串 自 身 连 接 多 次 ， 例 如 r 表示 


OF # te 9 


PE A 


a 

字符 串 的 字典 序 (lexicographic order) 和 大 家 熟悉 的 字典 顺序 一 样 。 通 常 ， 我 们 采用 
字符 串 顺 序 (shortlex order 或 string order) ， 它 在 字典 序 基础 上 将 短 的 字符 串 排 在 长 的 字 
符 串 的 前 面 。 例如， 字母 表 (0, 1) 上 的 所 有 字符 串 的 字符 串 顺 序 为 Ce,0,1,00,01,11, 
000 ，… ) 。 

字符 串 zx 是 字符 串 y 的 前 缀 (prefix)， 如 果 存 在 字符 串 z 满足 zz 一 y， 并 且 若 Hy, 
WW r 称 为 y WAR (proper prefix)。 字 符 串 的 集合 称 为 语言 (language)。 如 果 语 言 中 
任何 一 个 成 员 都 不 是 其 他 成 员 的 真 前 级， 那么 该 语言 是 无 前 缀 的 (prefix-free)。 


0.2.6 布尔 逻辑 


布尔 逻辑 (Boolean logic) 是 建立 在 TRUE 和 FALSE 两 个 值 上 的 代数 系统 。 这 个 系 
统 最 初 是 作为 纯 数学 构想 提出 来 的 ， 现 在 被 公认 为 是 数字 电子 学 和 计算 机 设计 的 基础 。 值 
TRUE 和 值 FALSE 被 称 为 布尔 值 (Boolean value) ， 并 且 经 常用 值 1 和 值 0 表示。 在 有 两 
种 可 能 的 时 候 使 用 布尔 值 ， 例 如 一 条 电路 可 能 处 于 高 电位 或 低 电 位 ， 一 个 命题 可 能 是 真 或 
假 ， 对 一 个 问题 的 回答 可 能 为 是 或 否 。 

可 以 用 布尔 运算 (Boolean operation) 处理 布 尔 值 。 最 简单 的 布尔 运算 为 非 (negation) 
或 NOT 运算 ， 用 符号 “一 ”表示 。 一 个 布尔 值 的 非 为 与 它 相 反 的 值 ， 即 0 二 1, 一 1 二 0。 合 
取 (conjunction) 或 AND 运算 的 符号 为 “人 ”。 仅 当 两 个 布尔 值 都 为 1 时 ， 它 们 的 合 取 为 
1。 析 取 (disjunction) 或 OR 运算 的 符号 为 “V”。 当 两 个 布尔 值 中 有 一 个 为 1 时 ， 它 们 
的 析 取 为 1。 下 面 综 合 列 出 上 述 运算 的 定义 : 


0A0=0 0V0=0 “i= 
0A 1=0 OV1=1 "Ip 
1A0=0 1 V0=1 
1A1=] LYS] 


使 用 布尔 运算 可 以 把 简单 的 命题 组 合成 更 复杂 的 布尔 表达 式 ， 就 像 使 用 算术 运算 十 和 
X 构 造 复杂 的 算术 表达 式 一 样 。 例 如 ， 设 已 是 表示 命题 “现在 天 气 畏 朗 ” 的 真 假 值 的 布尔 
值 ，Q 是 表示 命题 “今天 是 星期 一 ”的 真 假 值 的 布尔 值 ， 那 么 可 以 用 PA 和信 Q 表示 命题 “ 现 
在 天 气 晴 朗 并 且 今 天 是 星期 一 ”的 真 假 值 。 对 于 PV Q, 与 此 类 似 ， 只 需 把 “并 且 ” 换 成 
“WA”. É P 和 Q 称 为 该 运算 的 运算 对 象 (operand). 

偶尔 会 用 到 另外 几 个 布尔 运算 。 异 或 (exclusive or) 运算 (或 者 XOR ZA) 的 符号 
为 “由 ”， 当 它 的 两 个 运算 对 象 中 一 个 为 1、 另 一 个 为 0 时 其 值 为 1。 等 值 (equality) 运算 
的 符号 是 “<*>”， 当 它 的 两 个 运算 对 象 取 值 相同 时 其 值 为 1。 最 后 ， 蕴 涵 (implication) 运 
算 的 符号 是 “一 ”， 并 且 当 它 的 第 一 个 运算 对 象 为 1、 第 二 个 运算 对 象 为 0 时 其 值 为 0; 否 
则 为 1。 下 面 综合 列 出 这 些 定义 : 


0 中 0=0 0<>0 一 1 o=ü=] 
0o@1=1 0<>1 一 0 0-=1 一 ] 
1@0=1 1-0=0 1>0=0 
1@1=0 teil 1+1=1 


可 以 给 出 这 些 运算 之 间 的 各 种 关系 。 实 际 上 ， 能 用 AND 与 NOT 运算 来 表示 所 有 的 


布尔 运算 ， 如 下 面 的 式 子 所 示 。 每 一 行 的 两 个 表达 式 是 等 价 的 。 每 一 行 用 它 上 面 的 运算 及 
AND, NOT 表示 左边 一 列 的 运算 。 


17 PA7Q) 
P+Q 7PVQ0 

P<+Q (PQ) A (Q>P) 
POQ =1CP<+Q) 


AK AND 5 OR 的 分 配 律 (distributive law) 在 处 理 布 尔 表 达 式 时 会 有 用 。 它 很 像 有 


关 加 法 与 乘法 的 分 配 律 aX (5 十 c)= 二 (aX6b) 十 (aXc)。 布尔 分 配 律 有 以 下 两 种 形式 ， 


© PA(QVR) 等 于 (PAQV (PAR) 
© PV (QAR) 等 于 (PVQ)A(PYR) 


0.2.7 数学 名 词汇 总 


字母 表 符号 对 象 的 有 穷 集 合 。 

自 变量 函数 的 输入 。 

二 元 关系 定义 域 为 有 序 对 集合 的 关系 。 

布尔 运算 布尔 值 的 运算 。 

布尔 值 值 TRUE 或 值 FALSE， 常 用 1 或 0 表示 。 

笛 卡 儿 积 对 多 个 集合 的 运算 ， 用 分 别 来 自 这 些 集合 的 元 素 的 所 有 多 元 组 构成 一 
BE 

补 对 一 个 集合 的 运算 ， 用 不 在 这 个 集合 中 的 所 有 元 素 构成 一 个 集合 。 

连接 把 多 个 字符 串 连 接 在 一 起 的 运算 。 

合 布尔 运算 AND. 

连通 图 每 一 对 顶点 都 有 路 径 相 连 的 图 。 

图 起 止 在 同一 个 顶点 的 路 径 。 

有 向 图 顶点 和 连接 某 些 顶 点 的 箭头 构成 的 集合 。 

析 取 布尔 运算 OR. 

定义 域 了 水 数 所 有 可 能 的 输入 构成 的 集合 。 

边 图 中 的 一 条 线段 。 

元 素 集合 中 的 一 个 对 象 。 

空 集 没有 任何 元 素 的 集合 。 

空 串 长 度 为 零 的 字符 串 。 

等 价 关 系 目 反 、 对 称 和 传递 的 二 元 关系 。 

函数 把 输入 转变 成 输出 的 运算 。 

图 顶点 和 连接 某 些 顶 点 的 线段 构成 的 集合 。 

交 对 多 个 集合 的 运算 ， 用 这 几 个 集合 的 共同 元 素 构成 一 个 集合 。 

k 元 组 一 列 上 个 对 象 。 

语言 字符 串 的 集合 。 

成 员 集合 中 的 一 个 对 象 。 

结 点 图 中 的 一 个 点 。 

有 序 对 一 对 有 序 的 元 素 。 


路 径 图 中 用 边 连接 起 来 的 顶点 序列 。 
谓词 以 {TRUE, FALSE} 为 值 域 的 函数 。 
性 质 一 个 谓词 。 
值 域 一 个 集合 ， 函 数 的 输出 都 取 自 这 个 集合 。 
关系 一 个 谓词 ， 最 典型 地 ， 其 定义 域 为 & 元 组 集合 。 
序列 排列 成 一 列 的 对 象 。 
合 一 组 对 象 。 


简单 路 径 顶点 不 重复 的 路 径 。 
单元 素 集合 ”只 有 一 个 成 员 的 集合 。 


FF MA—SFHRRN—WMA ATS 

符号 FERITA. 

BY 不 含 简 单 圈 的 连通 图 。 

并 对 多 个 集合 的 运算 ， 把 这 几 个 集合 中 的 所 有 元 素 合 并 成 一 个 集合 。 
二 元 集合 含有 两 个 成 员 的 集合 。 

顶点 图 中 的 一 个 氮 。 


0.3 定义 、 定 理 和 证 明 


定理 和 证 明 是 数学 的 精髓 ， 而 定义 是 数学 的 灵魂 。 这 三 部 分 是 包括 本 科目 在 内 的 每 个 
数学 科目 的 核心 。 

定义 (definition) 描述 了 我 们 使 用 的 对 象 和 概念 。 定 义 可 能 是 简单 的 ， 如 本 章 已 给 出 
的 集合 的 定义 ; 也 可 能 是 复杂 的 ， 如 密码 系统 中 对 安全 的 定义 。 任 何 数学 定义 都 必须 是 精 
确 的 。 当 定义 一 个 对 象 时 ， 必 须 弄 清楚 什么 构成 这 个 对 象 、 什 么 不 构成 这 个 对 象 。 

在 定义 各 种 对 象 和 概念 之 后 ， 通 常 要 给 出 关于 它们 的 数学 命题 (mathematical state- 
ment) 。 典 型 情况 下 ， 一 个 命题 描述 某 个 对 象 具 有 某 种 性 质 。 命 题 可 能 为 真 ， 也 可 能 为 假 ， 
但 和 定义 一 样 必须 是 精确 的 。 它 的 含义 不 能 有 任何 模棱两可 的 地 方 。 

证 明 (proof) 是 一 种 逻辑 论证 ， 它 使 人 们 确信 一 个 命题 为 真 。 在 数学 中 ， 一 个 论证 
必须 无 懈 可 击 的 ， 也 就 是 说 ， 论 证 要 使 人 绝对 信服 。 它 和 我 们 在 日 常生 活 中 或 在 法 律 上 使 
用 的 证 据 这 一 概念 有 很 大 的 区 别 。 在 谋杀 案 审 判 中 要 求 存 在 “没有 任何 合理 疑点 ”的 证 
据 。 重 要 的 证 据 可 能 迫使 陪审 团 接受 疑犯 无 罪 或 有 罪 的 辩护 。 但 是 ， 这 种 证 据 在 数学 证 明 
中 不 起 作用 。 数 学 家 需要 没有 任何 疑点 的 证 明 。 

定理 (theorem) 是 被 证 明 为 真 的 数学 命题 。 通 常 只 对 特别 感 兴 趣 的 命题 使 用 这 个 词 。 
有 时 ， 有 兴趣 证 明 某 些 命题 只 是 因为 它们 有 助 于 证 明 另 一 个 更 有 意义 的 命题 ， 这 样 的 命题 
称 为 引 理 〈lemma) 。 有 时 ， 一 个 定理 或 其 证 明 可 以 使 我 们 容易 得 出 另外 一 些 有 关 的 命题 
为 真 的 结论 ， 这 些 命 题 称 为 这 个 定理 的 推论 (corollary). 


寻找 证 明 


给 出 数学 证 明 是 确定 一 个 数学 命题 为 真 或 假 的 唯一 方法 。 可 是 ， 找 到 数学 证 明 并 不 总 
是 容易 的 事情 。 不 可 能 把 它 简 化 为 一 组 简单 的 规则 或 过 程 。 在 本 书 中 ， 我 们 要 求 给 出 各 种 
命题 的 证 明 。 请 不 要 气 包 ! 因为 虽然 没有 任何 人 有 制造 证 明 的 诀 穿 ， 但 是 我 们 可 以 利用 一 
些 有 用 的 普遍 性 策略 。 


首先 ， 要 仔细 地 看 清楚 要 证 明 的 命题 。 是 否 理解 命题 的 所 有 记号 ? 先 用 自己 的 语言 
命题 重 写 一 遍 。 把 它 拆 开 并 且 分 别 考虑 每 一 部 分 。 

有 时 候 由 若干 部 分 组 成 的 命题 的 各 个 部 分 并 不 都 是 明显 的 。 这 种 命题 经 常 出 现 的 一 种 
形式 是 “P 的 充分 必要 条 件 是 QQ”， 其 中 P 和 QQ 为 两 个 数学 命题 。 这 种 写法 是 对 一 个 由 两 
部 分 组 成 的 命题 的 缩写 。 第 一 部 分 是 “PP 仅 当 Q”,， 它 的 意思 为 : APPAR, WOAH, 
ER PSQ. BRIE “P 当 Q”， 它 的 意思 为 : 若 Q 为 真 ， 则 P 为 真 ， 写 成 P<Q。 第 
一 部 分 是 原 命 题 的 向 前 方向 (forward direction)， 第 二 部 分 是 反方 向 (reverse direction), 
把 “P 的 充分 必要 条 件 是 Q” 写 成 P 舍 Q@。 要 证 明 这 种 形式 的 命题 ， 必 须 证 明 这 两 个 方向 
中 的 每 一 种 情况 。 通 常情 况 下 ， 这 两 个 方向 中 一 个 比 另 一 个 容易 证 明 。 

这 种 命题 的 男 一 种 类 型 是 陈述 两 个 相等 的 集合 A 和 B。 它 的 第 一 部 分 说 明 A 是 B 的 
子 集 ， 第 二 部 分 说 明 B 是 A 的 子 集 。 所 以 ,证 明 A=B 的 通用 方法 : 证 明 A 的 每 一 个 元 
素 也 为 B 的 元 素 ， 以 及 B 的 每 一 个 元 素 也 为 A 的 元 素 。 

其 次 ， 当 想 证 明 一 个 命题 或 它 的 一 部 分 时 ， 要 尽 可 能 证 明 它 为 什么 应 该 为 真 。 在 证 明 
之 前 ， 先 举 一 些 例子 对 完成 证 明 会 很 有 帮助 。 例 如 ， 如 果 命 题 称 某 种 类 型 的 所 有 对 象 都 有 
一 种 特定 的 性 质 ， 那 么 取 几 个 这 种 类 型 的 对 象 并 且 观 察 它们 确实 具有 这 种 性 质 。 这 样 做 之 
后 ， 青 试 试 找 一 个 不 具有 这 种 性 质 的 对 象 ， 这 样 的 对 象 称 为 反例 (counterexample), oR 
命题 确实 为 真 ， 就 不 可 能 找到 反例 。 当 试图 找 反 例 时 看 看 在 什么 地 方 遇 到 了 困难， 这 能 够 
帮助 我 们 理解 该 命题 为 什么 为 真 。 

假设 要 证 明 命题 ， 对 于 每 一 个 图 G，G 中 所 有 顶点 度数 之 和 为 偶数 。 

首先 ， 画 几 个 图 ， 观 察 这 个 命题 的 实际 情况 。 图 0- 11 是 两 个 例子 。 

然后 ， 去 找 反 例 ， 即 顶点 度数 之 和 为 奇数 的 图 。 发 现 每 增加 一 条 边 ， 度 数 之 和 增加 2。 
见 图 0-12。 


(2 aFa 
Fh FATAN 
顶点 度数 之 和 顶点 度数 之 和 
一 2+2+2 一 0 一 2+3+4+3+2 一 14 
0-11 两 个 例子 图 0-12 每 次 增加 一 条 边 ， 和 增加 2 
现在 ， 你 能 开始 看 出 命题 为 什么 为 真 和 怎样 证 明 它 了 吧 ? = 


如 果 仍 然 不 能 直接 证 明 这 个 命题 ， 那 么 试 试 证 明 容 易 一 点 的 事情 ， 即 去 证 明 这 个 命题 
的 一 种 特殊 情况 。 例 如 ， 如 有 果 要 证 明 对 于 每 一 个 二 0， 某 个 性 质 为 真 ， 先 去 证 明 对 于 = 
1 它 为 真 。 如 果 成 功 了 ， 再 去 证 明 对 于 二 2 等 等 它 为 真 ， 直 到 能 够 证 明 更 一 般 的 情况 。 如 
果 一 种 特殊 情况 是 难 证 明 的 ， 那么 去 试 试 证 明 男 一 个 不 同 的 特殊 情况 ,或 者 还 可 能 是 这 个 
特殊 情况 的 特殊 情况 。 

最 后 ， 当 确信 已 经 找到 证 明 的 时 候 ， 必 须 将 它 严 格 地 书写 出 来 。 一 个 写 得 很 好 的 证 明 
是 一 系列 的 形式 化 描述 ， 其 中 每 一 条 语句 都 由 前 面 的 语句 经 过 简单 的 推理 得 到 。 仔 细 书 写 
证 明 非 常 重要 ， 这 样 既 能 够 让 读者 理解 它 ， 又 能 够 保证 它 正 确 无 误 。 

以 下 是 关于 构造 证 明 的 几 点 建议 : 

。 要 有 耐心 。 寻 找 证 明 需 要 时 间 。 如 有 果 没 有 马上 看 出 怎么 着 手 证 明 ， 也 不 必 烦 恼 。 


为 了 找到 一 个 合适 的 证 明 ， 研 究 人 员 有 时 要 工作 数 周 甚至 数 年 。 
回头 做 。 看 一 遍 要 证 明 的 命题 ， 考 虑 一 会 儿 ， 然 后 放下 它 ， 过 一 小 段 时 间 之 后 再 
回 到 这 个 问题 上 来 。 让 你 内 心 的 潜意识 和 直觉 有 机 会 起 作用 。 
条 例 清 晰 。 当 对 要 证 明 的 命题 进行 直觉 分 析 时 ， 请 使 用 简单 明了 的 图 形 或 文字 描 
述 ， 也 可 以 两 者 同时 使 用 。 当 你 正在 深入 研究 这 个 命题 时 ， 杂 乱 无 章 会 妨碍 深入 
研究 。 此 外 ， 把 一 个 结果 写 给 别人 看 ， 清 晰 的 表述 有 助 于 别人 理解 。 
表达 简洁 。 简 洁 有 助 于 表达 高 层次 的 思想 而 不 丧失 细节 。 好 的 数学 表示 法 有 利于 
简明 地 表达 思想 。 但 是 ， 在 写 证 明 的 时 候 必须 充分 地 写 出 你 的 推理 ， 让 读者 能 够 
容易 理解 所 证 明 的 东西 。 

为 了 说 明 具 体 的 做 法 ， 让 我 们 以 证 明 德 .摩根 律 之 一 为 例 。 

对 于 任意 两 个 集合 A 和 B, AUB=ANB. 

首先 ， 要 搞 清楚 这 个 定理 的 意思 。 如 果 不 知道 符号 U 、 门 或 上 横 线 的 意思 ， 请 复习 前 
面 (0.2.14) MAA. 

为 了 证 明 这 个 定理 ， 必 须 证 明 两 个 集合 AUB 与 A 门 B 相 等 。 前 面 讲 过 ， 可 以 通过 证 明 
一 个 集合 的 每 一 个 元 素 也 是 另 一 个 集合 的 元 素 和 反之 亦 真 来 证 明 两 个 集合 是 相等 的 。 在 看 
下 面 的 证 明之 前 ， 请 先 考虑 几 个 例子 ， 自 己 试 试 去 证 明 它 。 

证 明 这 个 定理 称 两 个 集合 AUB 与 A 门 B 相 等 。 通 常 证 明 如 下 ， 通 过 说 明 一 个 集合 的 
每 一 个 元 素 也 是 另 一 个 集合 的 元 素 并 且 反 之 亦 真 来 证 明 这 个 断言 。 

假设 x 是 A U B 的 一 个 元 素 ， 那 么 ， 由 集合 的 补 集 的 定义 可 知 ，zx 不 在 集合 AUB 中 。 
故 由 两 个 集合 的 并 集 的 定义 可 知 ，z 不 在 集合 A PAHs 不 在 集合 B 中 。 亦 即 ，z 在 集合 A 
PAs 在 集合 B 中 。 因 此 ,根据 两 个 集合 的 交集 的 定义 ，z 在 集合 ANB P. 

反之 亦 然 ， 假 设 x 在 集合 A 门 B t, WA, 既 在 集合 A 中 、 又 在 集合 中。 因此 ， 
zx 就 不 在 集合 A PAs 不 在 集合 B 中 ， 亦 即 不 在 这 两 个 集合 的 并 集中 。 所 以 ，x 在 这 两 个 
集合 的 并 集 的 补 集中 ， 即 是 说 ，z 在 集合 A U B 中 。 该 定理 的 证 明 完毕 。 w 

现在 证 明 例 0. 9 中 的 命题 。 

(起 天 路 ”在 任意 一 个 图 G 中 ，G 的 所 有 顶点 度数 之 和 为 偶数 。 

证 明 G 中 对 每 一 条 边 连 接 两 个 顶点 ， 每 一 条 边 对 连接 它 的 每 一 个 顶点 贡献 的 度数 是 
1。 故 每 一 条 边 对 所 有 顶点 贡献 的 度数 之 和 为 2。 所以， 如 果 G 包含 e 条 边 ， 则 G 的 所 有 
顶点 度数 之 和 等 于 2e， 这 是 一 个 偶数 。 æ 


0.4 证 明 的 类 型 


在 数学 证 明 中 通常 会 出 现 多 种 类 型 的 论证 。 我 们 在 这 里 描述 几 种 在 计算 理论 中 常用 的 
类 型 。 因为 一 个 证 明 可 以 分 成 藻 干 不 同 部 分 ， 每 一 部 分 也 是 一 个 证 明 ， 所 以 请 注意 ， 一 个 
证 明 可 以 包含 一 种 以 上 的 论证 类 型 。 








0.4.1 构造 性 证 明 


许多 定理 声明 存在 一 种 特定 类 型 的 对 象 。 通 过 说 明 如 何 构 造 这 样 的 对 象 是 证 明 这 种 定 
理 的 一 种 方法 ， 这 种 方法 就 是 构造 性 证 明 (proof by construction). 
现 采 用 构造 性 证 明 方法 证 明 以 下 定理 。 我 们 定义 : 如 果 图 中 每 一 个 顶点 的 度数 都 为 &， 


则 称 这 个 图 是 & 正 则 的 (A regular). 

对 于 每 一 个 大 于 2 的 偶数 n， 存 在 一 个 有 nn 个 顶点 的 3 正则 图 。 

证 明 设 n 是 大 于 2 的 偶数 。 现 构造 有 个 顶点 的 图 G= 二 (V,E)，G 的 顶点 集 为 V= 
{(O,1,«*,8—1}, RW 

E={{i,i+1} | 0ixn—2}U({n—1,0}} 一) 

现在 沿 着 一 个 圆 的 圆周 顺序 画 出 这 个 图 的 所 有 顶点 。E 等 号 右边 的 上 一 行 描述 的 边 连接 辆 
周 上 相 邻 的 一 对 顶点 ， 下 一 行 描述 的 边 连接 一 个 顶点 与 它 对 面 的 项 点。 这 个 想象 的 图 清楚 
地 表明 G 的 每 一 个 顶点 的 度数 为 3。 故 按照 上 面 的 定义 ， 证 得 该 命题 为 真 。 a 


0.4.2 反 证 法 


另 一 种 常用 的 证 明定 理 的 论证 方法 是 ， 假 设 这 个 定理 为 假 ， 然 后 证 明 这 个 假设 会 导致 
一 个 明显 的 错误 结论 ， 故 而 相 矛 盾 。 在 现实 生活 中 经 常 使 用 这 种 类 型 的 推理 。 现 举例 
mF. 
EB AHALE GO 刚 从 外 面 进来 时 ， 发 现 她 全 身 衣服 是 干 的 ， 因 此 他 
推理 现在 没有 下 雨 ， 他 对 现在 没有 下 雨 的 “证 明 ” 是 这 样 推 理 的 ， 如 果 现 在 外 面 在 下 十 
(假设 命题 为 假 ) ， 吉 尔 身上 的 衣服 应 该 是 湿 的 〈 一 个 明显 的 错误 结论 ) 。 所 以 得 出 推论 ; 
现在 外 面 一 定 没有 下 雨 。 

下 面 我 们 采用 反 证 法 证 明 命题 : 2 的 平方 根 为 无 理 数 。 如 果 一 个 数 是 一 个 分 式 m/n, 
其 中 m 和 nn 是 整数 ， 则 这 个 数 是 有 理 数 (rational number) 。 换 言 之 ， 一 个 有 理 数 是 整数 
m 和 nn 的 比值 。 例如 2/3 显然 是 一 个 有 理 数 。 如 果 一 个 数 不 是 有 理 数 ， 则 它 为 无 理 数 


(irrational number), 


CEED /2ZABHK. 
证 明 ”为 了 得 到 矛盾 的 结论 ， 假 设 /2 是 有 理 数 。 于 是 


Z=” 


n 
此 处 m 和 nn 都 是 整数 。 如 果 mAn 都 能 被 同一 个 大 于 1 的 最 大 整数 除 尽 ， 则 用 那个 整数 
除 它 们 ， 不 会 改变 分 式 的 值 。 故 ，m 和 不可 能 均 为 偶数 。 
MH n 乘 等 式 的 两 边 ， 得 到 
nV2=m 
再 对 两 边 同 时 平方 ， 得 到 


由 于 m 是 整数 n? 的 2 信 ， 故 m? 是 偶数 。 所 以 m 也 是 偶数 ， 因 为 已 知 奇 数 的 平方 总 是 奇 
数 。 因 而 ， 对 于 某 个 整数 k, m=2k, FÆ, RIH 2k Rm EAER, 48 
2n? = (2k)? =4k? 
对 等 式 两 边 同 时 除 以 2， 得 到 
n? =2k? 
而 这 个 结果 表明 n 是 偶数 ， 从 而 n 是 偶数 。 于 是 ，m 和 nn 都 是 偶数 。 但 是 ， 前 面 已 经 化 
简 和 nn， 使 它们 不 会 都 是 偶数 ， 故 相 了 矛盾 。 所 以 ,V2 为 无 理 数 。 s 
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0.4.3 归纳 法 


归纳 法 是 证 明 无 穷 集合 的 所 有 元 素 具 有 某 种 特定 性 质 的 高 级 方法 。 例 如 ， 我 们 可 以 采 
用 归纳 法 证 明 ， 一 个 算术 表达 式 对 于 它 的 变量 的 每 一 组 赋值 都 能 够 计算 出 它 想 要 得 到 的 
值 ， 或 证 明 一 个 程序 在 每 一 步 或 对 所 有 的 输入 都 能 够 得 到 正确 的 结果 。 

为 了 描述 如 何 使 用 归纳 法 ， 我 们 把 无 穷 集 合 取 为 自然 数 集 N= 二 {1,2,3,…)}， 而 把 该 性 
质 称 为 P。 现 在 要 证 明 对 于 每 个 自然 数 上 PC(k) 为 真 。 换 言 之 ， 即 要 证 明 PO) WH, 
以 及 P(2)，P(3)，P(4) 等 等 均 为 真 。 

每 一 个 归纳 证 明 均 由 两 部 分 组 成 : 归纳 基础 (basis) 和 归纳 步骤 (induction step), 
每 部 分 自身 为 一 个 单独 的 证 明 。 归 纳 基 础 证 明 PO) 为 真 。 而 归纳 步骤 证 明 : 对 于 每 一 个 
i>l, WR PO 为 真 ， 则 P(i 十 1) 也 为 真 。 

只 要 我 们 完成 了 这 两 部 分 的 证 明 ， 就 能 得 到 命题 的 结果 : 即 对 于 每 一 个 i，P(i) 为 
真 。 为 什么 呢 ? 第 一 步 ， 证 明 PA) 为 真 ， 因 为 归纳 基础 已 经 单独 证 明 它 了 。 第 二 步 ， 通 
过 归纳 步骤 证 明 : 如 果 PA) AMPO) 为 真 ， 而 前 面 已 经 证 明了 Pd) XE, MA 
P(2) 也 为 真 。 第 三 步 ， 再 通过 归纳 步骤 证 明 : WR POO ARM PS) 为 真 ， 而 前 面 也 
已 经 证 明了 PO 为 真 ， 所 以 P(3) 也 为 真 。 将 这 种 过 程 对 所 有 的 自然 数 继续 证 明 下 去 ， 
会 发 现 P(4) AH, PG) 为 真 ， 等 等 。 

一 旦 理解 了 这 种 证 明 的 思路 ， 就 能 够 很 快 理解 这 种 证 法 的 变种 或 推广 。 例 如 ， 归 纳 基 
础 不 必 一 定 从 1 开始， 也 可 以 从 任意 的 值 b 开始 。 这 样 归纳 法 证 明 对 于 每 一 个 & 宇 3，P(k) 
均 为 真 。 

在 归纳 步骤 的 证 明 中 ， 对 假设 PG) 为 真 称 为 归纳 假设 (induction hypothesis) 。 假 设 
对 于 每 一 个 ji, PG) 为 真是 一 种 更 强 的 归纳 假设 ， 有 时 这 种 更 强 的 归纳 假设 在 证 明 中 
很 有 用 。 现 在 对 归纳 证 明 照 样 进行 下 去 ， 因 为 当 想 要 证 明 P(i 十 1) 为 真 时 ， 我 们 已 经 证 
明 对 于 每 一 个 ji, PG) AR. 

理解 这 种 证 明 方 法 后 ， 现 将 归纳 证 明 的 格式 书写 如 下 : 

归纳 基础 ”证明 PO) WAH. 


归纳 步骤 ”对 于 每 一 个 izl, 假设 P(i) AH, 并且 利用 这 个 假设 去 进一步 证 明 
P(i 十 1) 为 真 。 


现在 采用 归纳 法 来 证 明 房 产 抵 押 贷 球 的 月 付款 计算 公式 的 正确 性 。 很 多 人 借 钱 买房 子 
Ft AEA TAF A Di eB SEK. MR BORE 30 年 内 还 清 贷款 ， 典 型 的 方法 是 ， 在 还 贷 
条 款 中 规定 每 个 月 支付 固定 偿还 款额 ， 其 中 应 包括 利息 以 及 部 分 原 贷 款 金额 。 计 算 月 付款 
钱 数 的 公式 看 起 来 神秘 ， 其 实 十 分 简单 。 但 它 关 系 到 大 多 数 人 的 日 常生 活 ， 因 此 你 一 定 对 
它 感 兴趣 。 我 们 用 归纳 法 来 证 明 这 个 公式 的 正确 性 ， 这 对 归纳 法 是 个 很 好 的 说 明 。 

首先 ， 给 出 几 个 变量 的 名 称 及 其 含义 。 设 P 为 贷款 原始 数额 ， 称 为 本 金 。1 二 0 为 贷款 
的 年 利率 ，I 二 0. 06 表示 年 利率 为 6%，Y 为 月 付款 数 。 为 简便 起 见 ， 用 I 定义 另 一 个 变量 
M, 它 表示 月 倍增 系数 。 因 为 有 利息 的 缘故 ， 所 以 贷款 的 余额 每 个 月 按照 比率 M 会 发 生变 
化 。 因 为 月 利率 是 年 利率 的 1/12， 所 以 M=1 十 I/12， 并 且 逐 月 付 利 息 GRA BAI). 

每 个 月 还 款 有 两 部 分 。 第 一 部 分 是 ， 由 于 有 利息 ， 贷 款 的 余额 在 按照 月 倍增 系数 M 


增加 。 第 二 部 分 是 ， 由 于 每 月 付款 ， 贷 款 余 额 又 在 不 断 地 减少 。 设 P, 为 在 上 个 月 后 未 偿 
清 的 贷款 余额 ， 那 么 ，Po= 忆 为 贷款 的 原始 数额 ， 则 Pi 一 MPo 一 Y 为 一 个 月 后 的 贷款 余 
Ml, Pz=MP\—-Y 为 两 个 月 后 的 贷款 余额 ， 等 等 ， 依 此 类 推 。 现 在 形式 化 描述 定理 ， 给 出 
P, 的 计算 公式 ， 并 且 通 过 对 上 的 归纳 来 证 明 公 式 的 正确 性 。 

对 于 每 一 个 150, 





Beppe 
证 明 归纳 基础 ”证明 当 1=0 时 公式 成 立 。 如 果 二 0， 则 公式 为 
Po=PM -Y (F) 
这 里 MP 二 1。 因 而 可 以 简化 等 式 的 右 端 ， 得 到 
Py) =P 


根据 上 面 对 Po 的 定义 ， 这 是 正确 的 。 因 此 , 证 明了 第 一 步 归 纳 基 础 成 立 。 
归纳 步骤 ”对 于 每 一 个 & 宇 0 ， 假 设 当 t==k 时 公式 成 立 ， 现 要 证 当 上 一 & 十 1 时 公式 也 
成 立 。 由 归纳 假设 指出 





P,=PM'—y(—) 


M~—1 
现在 要 证 明 





pumpan (Mi) 


证 明 如 下 : 首先 ， 由 从 Pi 到 PWEN, BB 
P.41;=P.,.M—Y 
因此 ， 使 用 归纳 假设 可 计算 Pa, 49 


Piy = [PM -y(4— |M-y 
把 M 乘 进 去 并 且 改 写 Y， 得 到 








Pei 一 PMe —y (MM) _y (4) — pe —y (M) 
于 是 ， 当 t= 上 十 1 时 公式 也 成 立 ， 这 就 证 明了 定理 。 z 
请 参看 练习 0. 14， 试 试 采用 这 个 公式 计算 实际 的 抵押 付款 。 
练习 


0.1 考察 下 列 集合 的 形式 化 描述 ， 先 理解 它们 包括 什么 样 的 元 素 ， 写 一 段 简短 文字 描述 每 一 个 集合 。 
a. {153557 h 
b {ned — 2,0 52545}, 
c. {n | 对 NN 中 的 某 一 个 m,n 二 2m)。 
d. {n | 对 NN 中 的 某 一 个 m,n 二 2m, 并 且 对 N 中 的 某 个 有 ,n= 3k)。 
e.{w|w 是 0,1 FAE, H w 等 于 w 的 反 转 }。 
f. {n | n 是 一 个 整数 , 目 n=n+1}. 
0.2 试 写 出 下 列 集合 的 形式 化 描述 。 
a. 由 1、10 和 100 组 成 的 集合 。 b. 由 所 有 大 于 5 的 整数 组 成 的 集合 。 
ce 由 所 有 小 于 5 的 自然 数组 成 的 集合 。 d. 由 字符 串 aba 组 成 的 集合 。 


e 由 空 串 组 成 的 集合 。 f. 空 的 集合 。 

0.3 设 和 A 为 集合 {zx,y,z}，B 为 集合 {x,y}. 
a. A Æ BM FR? d. ANB 等 于 什么 ? 
b. B ÆA 的 子 集 吗 ? e. AXB 等 于 什么 ? 
c AUB 等 于 什么 ? f. B 的 容 集 等 于 什么 ? 


0.4 设 A 有 a 个 元 素 ，B 有 6。 个 元 素 , 问 AXB 中 有 多 少 个 元 素 ? 说 明理 由 。 

0.5 设 C 是 包含 c 个 元 素 的 集合 ,试问 C 的 宕 集中 有 多 少 个 元 素 ? 说 明理 由 。 

0.6 设 义 为 集合 (1,2,3,4,5}, 为 集合 {6,7,8,9,10}。 一 元 函数 f:X>Y 和 二 元 函数 9:XXY 一 Y 
如 下 表 所 示 : 





a. f(2) 的 值 等 于 什么 ? b. f 的 值 域 和 定义 域 是 什么 ? 
c. 9(2,10) 的 值 等 于 什么 ? d. 9 的 值 域 和 定义 域 是 什么 ? 
e 9(4,f(4)) 的 值 等 于 什么 ? 
0.7 对 下 列 每 一 小 题 ， 给 出 一 个 满足 指定 条 件 的 关系 。 
a. 自 反 的 和 对 称 的 ， 但 不 是 传递 的 。 b. 自 反 的 和 传递 的 ， 但 不 是 对 称 的 。 
c 对 称 的 和 传递 的 ， 但 不 是 自 反 的 。 
0.8 考虑 无 向 图 G=(V,E), HPW AB V={1,2,3,4}, WH E={({1,2},{2,3},{1,3},{2,4}, (1, 
4}}。 画 出 图 C。 各 顶点 的 度数 是 多 少 ? 试 在 图 中 标 出 一 条 从 顶点 3 到 顶点 4 的 路 径 。 
0.9 试 写 出 下 述 图 的 形式 化 描述 。 





问题 
0.10 ” 试 证 明 每 个 包含 两 个 或 两 个 以 上 结 点 的 图 应 包含 有 相等 度数 的 两 个 结 点 。 
0.11 请 找 出 下 述 证 明 中 的 错误 ， 它 证 明 所 有 马 的 颜色 相同 。 
断言 ”在 任意 一 个 包含 h 匹 马 的 集合 中 ， 所 有 马 的 颜色 相同 。 
证 明 对 有 h 作 归纳 证 明 。 
归纳 基础 ”对 于 hh 二 1， 在 任何 只 有 一 匹 马 的 集合 中 ， 显 然 所 有 马 的 颜色 相同 。 
归纳 步骤 ”对 于 kk 宇 1。 假 设 命题 对 于 hh 二 为 真 ， 要 证 明 命 题 对 于 h= 二 =k 十 1 也 为 真 。 
S 互 为 任意 一 个 有 & 十 1 匹 马 的 集合 ， 现 在 要 证 明 这 个 集合 中 所 有 马 的 颜色 相同 。 
从 这 个 集合 中 牵 走 一 匹 马 ， 得 到 集合 H, MW PRHA kL., REBAB, H 中 所 有 马 的 
颜色 相同 。 现 在 把 牵 走 的 马 重新 牵 回 来 ， 再 牵 走 另外 一 匹 马 得 到 集合 互 : 。 根 据 同样 的 道理 ， 万 ， 
中 所 有 马 的 颜色 也 应 相同 。 因 此 ， 五 中 所 有 马 的 颜色 一 定 相 同 。 


18 OF # # 
0.12 B S()=14+24+-+n En PARZ M, Cn) =1 +2 +e +n 是 前 7 个 立方 数 之 和 。 试 
通过 对 n 的 归纳 证 明 如 下 等 式 ， 从 而 得 到 对 每 一 个 n 有 C(n)= 二 S:(n) 这 一 有 趣 的 结论 。 
i Sin) = nn) i 
b. Cn) = Cn + 2n? +n?) =- (n+1)?, 
0.13 请 找 出 下 述 证 明 2==1 中 的 错误 。 
提示 : 考虑 方程 a 二 bp。 两 边 同 乘 以 a， 得 到 a? 天 cp。 两 边 同 时 减 去 内. 得 到 a? —b?=ab—Pb’, 
对 每 一 边 做 因 式 分 解 ， 得 (a 十 b)(a 一 5) 二 bl(a 一 b)。 用 (a 一 6) 除 每 一 边 ， 得 a 十 6 二 6。 最 后 ， 
A0.14 利用 定理 0. 15 试 推 导出 用 本 金 P、 利 率 工 和 付款 次 数 上 计算 抵押 贷款 的 月 付款 额 的 公式 。 假 设 
在 付 上 次 款 之 后 ， 贷 款 余额 减少 为 0。 对 于 30 年 的 抵押 贷款 ,假设 原 贷 款额 为 10 万 美元 ， 年利 
率 为 5%， 用 360 个 月 偿 清 ， 试 用 公式 计算 每 个 月 的 还 款额 。 
A* 0.15 Ramsey 定理 。 设 G 是 一 个 图 ，G 中 的 团 〈clique) 为 任意 两 个 顶点 都 有 边 相 连 的 子 图 。 反 团 
(anti-clique) 又 叫 作 独立 集 (independent set) ， 它 为 任意 两 个 顶点 都 没有 边 相 连 的 子 图 。 试 证 
明 : 所 有 nn 个 顶点 的 图 都 包含 一 个 顶点 数 不 少 于 万 logzn 的 团 或 反 团 。 
习题 选 解 
0.14 4 P,=0 并 解 出 Y， 以 得 到 公式 ; Y=PM:(M 一 1)/(M: 一 1)。 由 于 P= $100 000, I=0.05, 
t 二 360， 可 以 得 到 M 二 1 十 (0.05)/12， 经 过 计算 得 到 每 月 应 还 款 为 Y~ $ 536. 82。 
0.15 将 空间 划分 成 两 类 顶点 集 A 和 B。 然 后 扫描 整个 图 ， 如 果 顶 点 r 的 度数 大 于 空间 中 剩余 顶点 数 


目的 一 半 ， 则 把 z 加 到 A 中 ， 否 则 将 其 加 到 B 中 。 如 果 z 加 到 A 中 ， 则 不 再 考虑 所 有 不 与 其 
相连 的 顶点; WR xz 加 到 B 中 ， 则 不 再 考虑 所 有 与 其 相连 的 项 点。 重复 这 个 步骤 ， 直 到 处 理 完 
所 有 顶点 。 由 于 每 一 步 最 多 丢弃 一 半 的 顶点 ， 因 此 至 少 需要 经 过 logen 步 过 程 才 会 终止 。 由 于 


每 步 只 在 A 或 B 中 添加 一 个 顶点 ， 所 以 在 过 程 结束 后 A 或 B PED AAS logn 个 顶点 。 其 
中 ，A 中 包含 的 顶点 属于 团 ，B 中 包含 的 顶点 属于 反 团 。 
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计算 理论 的 第 一 个 问题 是 : 什么 是 计算 机 ? 这 或 许 是 一 个 很 简单 的 问题 ， 任 何人 都 知 
道 我 用 来 打字 的 这 个 东西 就 是 一 台 计 算 机 。 但 是 这 些 现实 的 计算 机 相当 复杂 ， 很 难 直接 对 
它们 建立 一 个 易于 处 理 的 数学 理论 ， 因 此 采用 称 为 计算 模型 computational model) 的 理 
想 计 算 机 来 描述 。 同 科学 中 的 其 他 模型 一 样 ， 一 个 计算 模型 准确 地 刻画 了 某 些 特征 ， 同 时 
忽略 一 些 特征 。 因 此 ， 针 对 关注 的 特性 ， 我 们 采用 几 个 不 同 的 计算 模型 。 本 书 从 最 简单 的 
模型 开始 ， 它 称 为 有 穷 状 态 机 (finite state machine) 或 有 穷 自 动机 9 (finite automaton). 


1.1 有 穷 自动 机 


有 穷 自动 机 是 描述 能 力 和 资源 极其 有 限 的 计算 机 的 模型 。 一 台 存 储 如 此 少 的 计算 机 能 
做 些 什么 呢 ? 回答 是 : 能 做 很 多 有 用 的 事情 ! 由 于 这 样 的 计算 机 存在 于 各 种 各 样 的 机 电 设 
备 的 核心 部 位 ， 因 此 事实 上 ， 我们 随时 都 在 和 它们 打交道 。 

如 图 1-1 所 示 ， 自 动 门 控制 句 就 是 这 类 设备 的 一 个 例子 。 


在 商场 的 人 口 和 出 口 常常 看 见 ， 当 控制 器 检测 到 有 人 正在 千 | 
近 时 ， 自 动 门 就 会 打开 。 自 动 门 的 前 面 有 一 个 缓冲 区 ， 用 来 
检测 是 否 有 人 想 进 来 。 在 门 的 后 面 有 男 一 个 缓冲 区 ， 使 得 控 
制 器 把 门 打开 足够 长 的 时 间 让 人 走 进 来 并 且 不 让 门 在 打开 的 | 
时 候 碰 到 站 在 它 后 面 的 人 。 mit RESTS 

控制 器 有 两 个 状态 ， OPEN 和 CLOSED， 分 别 表 示 门 的 开 和 关 ， 它 处 于 两 个 状态 之 
一 。 如 图 1-2 所 示 ， 有 4 种 可 能 的 输入 : FRONT (表示 门 前 面 的 缓冲 区 内 有 人 )、REAR 
(表示 门 后 面 的 缓冲 区 内 有 人 )、BOTH (表示 前 后 缓冲 区 内 都 有 人 )， 和 NEITHER (表示 
前 后 缓冲 区 内 都 没有 人 )。 

控制 器 根据 它 接收 的 输入 从 一 个 状态 转移 到 另 一 个 状态 。 当 它 处 于 CLOSED RAHA 
接收 到 输入 NEITHER 或 REAR 时 ， 它 仍 处 于 CLOSED 状态 。 而 且 ， 如 果 接 收 到 输入 
BOTH， 它 也 停留 在 CLOSED 状态 ， 因 为 打开 门 有 撞 倒 在 后 缓冲 区 里 的 人 的 危险 。 但 是 ， 
如 果 输 入 FRONT 来 到 ， 它 便 转 移 到 OPEN 状态 。 在 OPEN 状态 ， 如 果 接 收 到 输入 
FRONT, REAR 或 BOTH， 它 保持 在 OPEN 状态 不 动 。 如 果 输 入 NEITHER 来 到 ， 它 返 
回 到 CLOSED 状态 。 

例如 ， 控 制 器 可 能 开始 时 处 于 CLOSED 状态 并 且 接 收 到 下 述 一 系列 的 输入 信号: 
FRONT, REAR, NEITHER, FRONT, BOTH, NEITHER, REAR, NEITHER, $% 
A, ERAT FARA: CLOSED (开始 ) OPEN, OPEN, CLOSED, OPEN, OPEN, 
CLOSED, CLOSED, CLOSED, 


FAA SF BOL BEE OK 2b BB OT Pe a a ER ATTA. AT OR A 1-2 和 图 1- 3 所 


日 ”在 一 些 文献 中 也 被 译 为 “有 限 状态 机 ”或 者 “有 限 自 动机 ”。 一 一 译 者 注 
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可 能 表示 电梯 所 在 的 楼 层 ， 而 输入 可 能 是 从 按钮 接收 到 的 信号 。 这 人 台 计 算 机 可 能 需要 知 干 
位 存储 器 来 记 住 这 些 信息 。 各 种 家 电 设 备 ， 例 如 洗 碗 机 和 电子 恒温 器 以 及 部 分 电子 表 和 计 
算 胡 的 控制 右 也 都 是 只 有 有 限 存 储 的 计算 机 的 例子 。 设 计 这 种 装置 需要 知道 有 关 有 穷 自动 
机 的 方法 和 术语 。 


REAR FRONT 
BOTH REAR 
NEITHER A BOTH 
FRONT 输入 信号 
NEITHER FRONT REAR BOTH 
状态 CLOSED CLOSED OPEN CLOSED CLOSED 
NEITHER = OPEN CLOSED OPEN OPEN OPEN 
Al 1-2 Asie KAA 图 1-3 自动 门 控 制 器 的 状态 转移 表 


有 穷 自动 机 和 与 之 对 应 的 马尔 科 夫 链 (Markov chain) 常用 于 识别 数据 中 的 模式 。 这 
类 方法 常用 在 语音 处 理 和 光学 字符 识别 中 。 马 尔 科 夫 链 其 至 已 经 被 用 来 对 金融 市 场 中 价格 
的 变动 进行 建 模 和 预测 。 

下 面 从 数学 的 角度 考察 有 穷 自动 机 。 将 给 出 有 穷 自动 机 的 精确 定义 、 用 来 描述 和 处 理 
有 穷 自 动机 的 术语 以 及 描述 它们 的 能 力 及 其 限制 的 理论 结果 。 除 了 让 我 们 更 明确 地 理解 什 
么 是 有 穷 自动 机 和 它们 能 做 什么 、 不 能 做 什么 之 外 ， 这 些 理 论 开 发 工作 还 能 使 我 们 在 一 个 
相对 简单 的 环境 中 了 解数 学 定义 、 定 理 和 证 明 ， 并 且 逐 渐变 得 更 加 得 心 应 手 。 

在 叙述 有 穷 目 动机 的 数学 理论 的 初期 ， 只 做 抽象 的 描述 ， 不 涉及 任何 具体 的 应 用 。 图 
1-4 描述 了 一 个 有 穷 自 动机 ， 它 被 称 为 Mi。 

图 1-4 被 称 为 Mi 的 状态 图 (state diagram). 
它 有 3 个 状态 ， 记 作 aq ，g, 和 gq;。 起 始 状 态 (start 
state) q 用 一 个 指 回 它 的 无 出 发 点 的 箭头 表示 ， 接 
受 状 态 (accept state) gs, 带 有 双 圈 。 从 一 个 状态 指 
向 另 一 个 状态 的 箭头 称 为 转移 (transition). 人 

当 这 个 自动 机 接收 到 输入 字符 串 ， 例 如 1101 时 ， 它 处 理 这 个 字符 串 并 且 产 生 一 个 输 
出 。 输 出 是 接受 或 拒绝 。 为 简化 描述 过 程 ， 这 里 将 只 考虑 是 非 型 的 输出 。 处 理 从 Mi 的 起 
始 状态 开始 。 目 动机 从 左 至 右 一 个 接 一 个 地 接收 输入 字符 串 的 所 有 符号 。 读 到 一 个 符号 之 
后 ，Mi 沿 着 标 有 该 符号 的 转移 从 一 个 状态 移动 到 另 一 个 状态 。 当 读 到 最 后 一 个 符号 时 ， 
Mi 产生 它 的 输出 。 如 果 M 现在 处 于 一 个 接受 状态 ， 则 输出 为 接受 ; 否则 输出 为 拒绝 。 

例如 ， 把 输入 字符 串 1101 提供 给 图 1-4 中 的 有 穷 自动 机 Mi ， 处 理 步 骤 如 下 : 
. 开始 时 处 于 状态 qi 。 
. 读 到 1， 沿 着 转移 从 q 到 q，。 
. 读 到 1， 沿 着 转移 从 gq, 到 q， 。 
. 读 到 0， 沿 着 转移 从 a, 到 qo 
. 读 到 1， 沿 着 转移 从 q 到 g,。 
. 输出 接受 ， 因 为 在 输入 字符 串 的 末端 Mi 处 于 接受 状态 q， 。 
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用 这 人 台 机 响 对 各 式 各 样 的 输入 字符 串 进行 试验 ,得 知 它 接受 字符 串 1、01、11 和 
0101010101。 事 实 上 ，Mi 接受 以 1 结尾 的 任何 0、1 串 ， 因 为 只 要 读 到 1 它 就 到 达 接 受 状 
AS q, 。 此 外 ， 它 还 接受 字符 串 100、0100、110000 和 0101000000， 以 及 在 最 后 一 个 1 的 后 
面 有 偶数 个 0 的 任何 0、1 串 。 它 拒绝 其 他 的 0、1 串 ， 例 如 0，10，101000。 试 试 描述 由 
Mi 接受 的 所 有 字符 串 组 成 的 语言 ， 稍 后 我 们 将 做 这 件 事 情 。 


1.1.1 有 穷 自 动机 的 形式 化 定义 


上 一 小 节 用 状态 图 介绍 了 有 穷 自 动机 ， 这 一 小 节 将 形式 化 地 定义 有 穷 自 动机 。 虽 然 状 
态 图 易于 直观 地 理解 ， 但 基于 下 述 两 条 理由 还 需要 形式 化 的 定义 。 

首先 ， 形 式 化 定义 是 精确 的 。 它 能 消除 有 关 在 一 台 有 穷 自动 机 中 任何 不 明确 的 疑点 。 
如 果 不 清 楚 有 穷 自 动机 是 否 可 以 没有 接受 状态 ， 或 者 对 各 个 可 能 的 输入 符号 从 每 一 个 状态 
是 否 一 定 恰 好 引出 一 个 转移 ， 那 么 可 以 查阅 它 的 形式 化 定义 ， 并 且 得 到 证 实 对 这 两 个 问题 
的 回答 是 肯定 的 。 其 次 ， 形 式 化 定义 提供 了 一 种 表示 方法 ， 好 的 表示 方法 有 助 于 思考 并 清 
楚 地 表达 出 你 的 思想 。 

形式 化 定义 的 语言 多 少 有 点 神秘 ， 与 法 律 文件 的 语言 有 一 些 相 似 之 处 。 两 者 都 必须 是 
精确 的 ， 每 一 个 细节 必须 给 予 清 楚 的 说 明 。 

一 台 有 穷 自 动机 有 若干 部 分 。 它 有 一 个 状态 集 和 根据 输入 符号 从 一 个 状态 到 另 一 个 状 
态 的 规则 。 它 有 一 个 输入 字母 表 ， 指 明 所 有 人 允许 的 输入 符号 。 它 还 有 一 个 起 始 状态 和 一 个 
接受 状态 集 。 形 式 化 定义 把 一 台 有 穷 自 动机 描述 成 一 张 含 以 下 5 部 分 的 表 : 状态 集 、 输 入 
字母 表 、 动 作 规则 、 起 始 状态 以 及 接受 状态 集 。 用 数学 语言 表达 ，5 个 元 素 的 表 经 常 称 为 
5 元 组 。 因 此 ， 定 义 有 穷 自 动机 是 由 这 5 部 分 组 成 的 5 元 组 。 

用 转移 函数 (transition function) 定义 动作 规则 ， 常 记 作 6。 如 果 有 穷 自动 机 有 从 状 
A x 到 状态 y 标 有 输入 符号 1 的 箭头 ， 这 表示 当 它 处 于 状态 r 时 读 到 1， 则 转移 到 状态 y. 
可 以 用 转移 函数 讲 清楚 这 件 事 情 ， 记 作 SCz,1) 王 >y。 这 个 记号 是 一 种 数学 简写 方式 。 把 这 
些 结合 在 一 起 得 到 有 穷 自动 机 的 形式 化 定义 。 

有 穷 自动 机 是 一 个 5 元 组 (Q,5,6,g,,F)， 其 中 

1.Q 是 一 个 有 穷 集合 ， 称 为 状态 集 。 

2. 王 是 一 个 有 穷 集合 ， 称 为 字母 表 。 

3.6: QX3->~Q 是 转移 函数 5 。 

4. go EQ 是 起 始 状态 。 

5. FEQ 是 接受 状态 集 吕 。 

上 述 形式 化 定义 精确 地 描述 了 有 穷 自 动机 。 例 如 ， 回 到 先前 提出 的 那个 问题 : 是 否 允 
许 没有 接受 状态 ?可 以 看 到 ， 如 果 令 下 等 于 空 集 儿 就 没有 接受 状态 ， 因 此 对 这 个 问题 的 回 
答 是 肯定 的 。 此 外 ， 和 转移 函数 6 对 一 个 状态 和 一 个 输入 符号 的 每 一 种 可 能 的 组 合 恰好 指定 
了 下 一 个 状态 。 这 就 对 第 二 个 问题 做 出 肯定 的 回答 ， 表 明 对 各 个 可 能 的 输入 符号 从 每 一 个 
状态 恰好 引出 一 个 转移 箭头 。 

通过 指定 定义 1. 1 中 列 出 的 5 部分， 可 以 用 这 个 形式 化 定义 的 记号 描述 各 个 具体 的 有 穷 


O ”如 果 不 清 楚 SO: QXS-QHAM, WER 0.2.3 7. 
O ”接受 状态 有 时 也 称 作 终 结 状态 (final state). 
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自动 机 。 例 如 ， 回 到 图 1- 4 描述 的 有 穷 自动 机 Mi 。 为 便于 描述 在 这 里 将 其 重 画 ， 如 图 1-5 
所 示 。 

可 以 把 Mi 形式 地 写成 Mi =Q, Elg F), 
其 中 

1. Q— 4 2) vgs «Ga o 

2 B= tO, 1}, 

3. S 描述 为 图 1-5 有 穷 自 动机 Mi 








4.q, 是 起 始 状 态 。 

Sa P= pe} 

E A ELAM 接受 的 全 部 字符 串 集 ， 则 称 A 是 机 器 M 的 语言 ， 记 作 工 C(M) 王 A。 又 
称 M 识别 A 或 M 接受 A。 由 于 在 说 机 器 接受 字符 串 和 机 器 接受 语言 时 接受 一 词 有 不 同 的 
含义 ， 所 以 我 们 倾 问 于 对 语言 使 用 识别 二 字 以 避免 混 消 。 

一 台 机 融 可 能 接受 大 干 字符 串 ， 但 是 它 永 远 只 能 识别 一 个 语言 。 如 果 机 器 不 接受 任何 
字符 串 ， 那 么 它 仍 然 识别 一 个 语言 ， 即 空 语言 名。 

在 上 面 的 例子 中 , $ 

A 王 (zw| 芭 至 少 含 有 一 个 1 并 且 在 最 后 的 1 后面 有 偶数 个 0) 

IA, LM) =A, REF, Mi 识别 A. 


1.1.2 有 穷 自动 机 举例 


图 1- 6 是 有 穷 自动 机 M: 的 状态 图 。 
采用 形式 化 描述 ， Mz = ({g rgy) a 10s 1 Byaoi， 
{qo})o FEB RM OW 








图 1-6 2- 状 态 有 穷 目 动机 M2 的 状态 图 


FA, M: 的 状态 图 和 Ms 的 形式 化 描述 包含 相同 的 信息 ， 仅 仅 是 形式 不 同 。 如 果 需 
要 ， 和 总 可 以 由 其 中 的 一 个 得 到 另 一 个 。 

了 解 一 台 机 器 的 常用 方法 是 用 几 个 样本 输入 捉 做 测试 。 当 做 这 些 “ 试 验 ” 观 察 机 器 如 
何 工作 的 时 候 ， 通 常 ， 它 的 运行 方式 会 变 得 十 分 清楚 。 对 于 样本 串 1101，M 从 它 的 起 始 
状态 a, 开始 ， 首 先 读 到 第 一 个 1 后 转移 到 状态 g, ， 然 后 在 读 到 1，0 和 1 后 进入 到 状态 
do» 9, 和 gq, 。 这 个 字符 串 被 接受 ， 因 为 状态 qg 是 接受 状态 。 而 字符 串 110 使 M: 停留 在 
状态 q; ， 所 以 它 被 拒绝 。 再 试 几 个 例子 之 后 ， 可 以 看 出 M 接受 所 有 以 1 结束 的 字符 串 。 
于 是 ，L(Mi )= 二 {wl|w 以 1 AR). 


考虑 有 穷 自 动机 Ms ， 见 图 1- 7。 
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除 接 受 状态 的 位 置 之 外 ， 机 更 Ms 与 Mz 一样。 照例，Ms 接受 所 有 读 完 之 后 停留 在 接 
受 状 态 的 字符 串 。 注 意 ， 因 为 起 始 状 态 同时 也 是 接 


1 
空 串 ， 处 理 就 结束 了 。 因 此 ， 如 果 起 始 状 态 是 接受 
RE We 被 接受 。 除 空 串 之 外 ， 这 人 台 机 器 接受 任 A e 
何以 0 结束 的 字符 串 。 从 而 ， 
L(M:)={ wlw 是 2 Ee 或 以 0 结束 》 E 图 1-7 2- 状 态 有 穷 自动 机 Ms 的 状态 图 


UERS 图 1-8 给 出 一 台 5- 状 态 机 器 Mi。 
机 器 M 有 两 个 接受 状态 q 和 rl， 在 字母 表 
={a,b} 上 运行 。 试 验 表明 它 接受 字符 串 a，b， 

aa, bb 和 bab， 但 是 不 接受 字符 串 ab, ba 和 bb- 
ba。 这 台 机 器 从 状态 s 开始 ， 在 读 入 输入 字符 串 的 
第 一 个 符号 之 后 它 或 者 向 左 进 入 g 状态 ,或 者 向 右 
进入 r 状态 。 不 论 是 哪 种 情况 ， 它 都 不 可 能 返回 到 
起 始 状 态 (这 与 前 几 个 例子 是 不 同 的 )， 因 为 它 没 
有 办 法 从 任何 其 他 状态 回 到 状态 ;s。 如 果 输 入 字符 图 1-8 有 穷 自动 机 Mi 
串 的 第 一 个 符号 是 a， 那么 它 向 左 走 并 且 当 输入 申 
以 a 结束 时 接受 。 类 似 地 ， 如 果 第 一 个 符号 是 b， 那 么 它 向 右 走 并 且 当 输入 串 以 b 结束 时 
接受 。 所 以 ，M4 接受 开头 和 结尾 都 是 a 或 者 开头 和 结尾 都 是 b 的 所 有 字符 串 。 亦 即 ，M4 
接受 开头 和 结尾 符号 相同 的 所 有 字符 串 。 s 

URR 图 1-9 给 出 3- 状 态 机 器 Mi， 它 的 输入 字母 表 有 4 TAS. 5={(RESET)}, 
0,1,2}。 把 (RESET) 看 作 一 个 符号 。 

Blas Ms 以 模 3 的 方式 记录 它 在 输入 字符 串 
中 读 到 的 数字 之 和 。 每 次 读 到 符号 (RESET), 
它 将 计数 重新 置 0。 如 果 和 模 3 SFO, jjs: 

和 是 3 的 倍数 ， 则 Ms 接受 。 

在 某 些 情况 下 无 法 用 状态 图 来 描述 有 穷 a 
动机 。 当 状态 图 画 起 来 太 大 ， 或 者 像 在 下 个 例 
子 中 描述 依赖 于 有 穷 自动 机 的 某 个 未 具体 指定 
的 参数 时 就 有 可 能 这 样 。 在 这 些 情况 下 ， 将 采 
用 形式 化 描述 来 说 明 机 器 。 

Gee 考虑 例 1. 5 的 推广 ， 使 用 与 例 1.5 相同 的 4 个 符号 的 字母 表 了 。 对 每 一 
i 之 1,， 设 A 是 所 有 这 种 字符 串 的 语言 ， 其 中 数字 之 和 是 i 的 倍数 ， 当 碰 到 符号 (RESET) 
时 ， 和 被 重新 置 0。 对 于 每 一 个 A;， 给 出 识别 它 的 有 穷 自 动机 B;。 形 式 地 描述 机 器 B; 如 
F: B= (QiZ sinn ln KBQ: 是 i 个 状态 的 集合 (4g0591500 a) WIRE 
PAO: 使 得 对 每 一 个 17， 和 若 Bi 处 于 gj 时 ， 此 时 的 和 模 i 等 于 jy。 对 每 一 个 g;， 令 

ôi (q; ,0) 一 9) 
ôi (q; ,1) 一 9 ,这 里 二 JH mod 1 
ôi (q; »2)=q, 3X E k=j+2 modi 








图 1-9 有 穷 自 动机 M: 


ôi Cq; .(RESET)) =q, # 


1.1.3 计算 的 形式 化 定义 


至 此 已 用 状态 图 非 形 式 化 地 描述 了 有 穷 自 动机 ， 同 时 又 用 5 元 组 作为 形式 化 定义 描述 
了 它 。 非 形式 化 描述 易于 在 初期 掌握 ， 而 形式 化 定义 是 把 概念 完全 搞 清 楚 的 好 方法 。 形 式 
化 定义 能 够 清除 在 非 形式 化 描述 中 可 能 出 现 的 任何 二 义 性 。 下 面 对 有 穷 自 动机 的 计算 也 这 
样 做 。 由 于 已 经 有 了 关于 有 穷 自 动机 计算 方式 的 非 形 式 的 想法 ， 现 在 就 把 它 数 学 地 形 
Ths 

i M=(Q,3,0.q.F) #-BAF ADM, wH=wiwes w 是 一 个 字符 串 并 且 其 中 任 
一 wi EFRI 的 成 员 。 如 果 存 在 Q 中 的 状态 序列 ro ,ri，…,r,， 满 足下 述 条 件 : 

ls r= 

2. 0(7i 30Wi+1)= 7i+19t—0,5°*,n—1 

3. r EF 
则 M #2 w. 

条 件 1 说 机 器 从 起 始 状态 开始 。 条 件 2 说 机 器 按照 转移 函数 从 一 个 状态 到 一 个 状态 。 
条 件 3 说 如 果 机 器 结束 在 接受 状态 ， 则 接受 它 的 输入 。 如 果 A 二 {w|M ÈZ w), Wg M 
识别 语言 A。 

如 果 一 个 语言 被 一 台 有 穷 自 动机 识别 ， 则 称 它 是 正则 语言 (regular lan- 
guage), 

以 例 1.5 中 的 机 器 Ms AB, S w 是 字符 串 

10(¢ RESET) 22(RESET)012 
由 于 当 Ms 对 w 计算 时 进入 的 状态 序列 为 
do 29) 291 40 292 2°91 40 290 341 9A 

它 满足 上 述 3 个 条 件 ， 根 据 计 算 的 形式 化 定义 ，Ms Hew. Ms 的 语言 是 

L(Ms ) 二 {w| 除 (RESET) 将 计数 重新 置 0 之 外 ,w 中 所 有 符号 之 和 模 3 等 于 0} 
因为 Ms 识别 该 语言 ， 所 以 它 是 正则 语言 。 z 


1.1.4 设计 有 穷 目 动机 


不 论 是 目 动机 还 是 艺术 品 ， 设 计 都 是 一 个 创作 过 程 ， 因 此 不 可 能 把 它 归 结 为 一 个 简单 
的 处 方 或 公式 。 然 而 ， 可 以 找到 一 种 特殊 的 做 法 ， 在 设计 各 种 类 型 的 自动 机 时 都 是 有 帮助 
的 。 设 计 者 把 目 己 放 在 所 要 设计 的 机 需 的 位 置 上 ， 考 虑 一 下 如 何 去 实 现 机 器 的 任务 。 把 自 
己 假 想 成 机 岩 是 一 种 心理 上 的 技巧 ， 有 助 于 设计 者 把 全 部 思维 投入 到 设计 过 程 中 。 

用 上 面 描述 的 “读者 即 目 动机 ”方法 设计 有 穷 自动 机 。 假 设 有 某 个 语言 ， 要 设计 一 台 
识别 它 的 有 穷 自 动机。 假定 设计 者 自己 就 是 这 人 台 有 穷 自动 机 ， 接 到 一 个 输入 字符 串 并 且 要 
确定 它 是 不 是 这 人 台 目 动机 所 识别 的 语言 的 成 员 。 设 计 者 一 个 接 一 个 地 读 这 个 字符 串 的 符 
号 。 在 读 到 每 一 个 符号 之 后 设计 者 必须 确定 到 现在 为 止 所 看 到 的 字符 串 是 否 在 这 个 语言 
中 。 理 由 是 设计 者 和 机 右 一 样 不 知道 字符 串 什么 时 候 结 束 ， 因 此 必须 随时 准备 好 答案 。 

首先 ， 为 了 能 做 出 这 样 的 判断 ， 必 须 估算 出 当 读 一 个 字符 串 时 需要 记 住 它 的 哪些 东 
西 。 为 什么 不 直接 记 住 所 看 到 的 全 部 东西 呢 ? 记 住 当 前 设计 者 是 一 台 有 穷 自 动机 ， 这 种 类 





型 的 机 器 只 有 有 穷 个 状态 ， 这 意味 着 只 有 一 个 有 穷 的 存储 器 。 想 象 某 个 输入 极 长 ， 比 如 说 
有 从 地 球 到 月 球 那 么 长 ， 因 此 设计 者 不 可 能 记 住 所 有 的 事情 。 设 计 者 有 一 个 有 穷 的 存储 
器 ， 比 如 说 是 一 张 纸 ， 它 只 有 有 限 的 存储 能 力 。 幸 运 的 是 ， 对 许多 语言 不 需要 记 住 整个 输 
入 ， 只 需要 记 住 某 些 关键 的 信息 ， 那 些 信息 恰好 是 关键 的 并 且 与 所 考虑 的 具体 语言 有 关 。 

例如 ， 假 设 字母 表 是 {0,1}， 所 考虑 的 语言 由 所 有 含有 奇数 个 1 的 字符 串 组 成 。 目 标 
是 构造 一 台 有 穷 自动 机 E 以 识别 这 个 语言 。 设 想 设 计 者 就 是 这 人 台 目 动机， 开始 一 个 符号 
接 一 个 符号 地 得 到 一 个 0、1 输入 串 。 为 了 确定 1 的 个 数 是 否 为 奇数 ， 需 要 记 住 至 此 所 看 
到 的 整个 字符 串 吗 ? 当然 不 需要 。 只 需 简单 地 记 住 至 此 所 看 到 的 1 的 个 数 是 偶数 还 是 奇 
数 ， 并 且 在 读 新 的 符号 时 保持 与 这 个 信息 的 联系 。 如 果 读 到 1， 就 把 答案 从 偶数 变 成 奇数 
或 者 从 奇数 变 成 偶数 。 如 果 读 到 0， 则 答案 保持 不 变 。 

但 是 这 些 怎样 帮助 设计 者 设计 El 呢 ? 一 旦 确定 了 要 记 住 的 有 关 读 过 的 字符 串 的 必要 
信息 ， 就 把 这 些 信 息 列 成 一 份 可 能 性 的 有 限 清 单 。 在 这 个 实例 中 ， 可 能 性 有 : 

1. 到 此 为 止 是 偶数 。 

2. 到 此 为 止 是 奇数 。 
然后 ， 给 每 一 种 可 能 性 设计 一 个 状态 。 这 些 就 是 Ei 的 全 部 状态 ， 如 图 1- 10 所 示 。 

然后 ， 通 过 观察 如 何 根据 读 到 的 符号 从 一 种 可 能 性 到 另 一 种 可 能 性 来 设计 转移 。 因 
此 ， 如 果 状 态 gs 表示 偶数 可 能 性 、 状 态 gous 表示 奇数 可 能 性 ， 这 样 可 以 给 出 所 有 的 转 
移 ， 读 到 1 改变 状态 ， 读 到 0 保持 状态 不 变 ， 如 图 1- 11 所 示 。 


图 b= IO 状态 Deven 和 状态 dodd 





接 下 来 ， 把 起 始 状态 设置 为 对 应 于 到 现在 为 止 还 没有 看 到 与 
任何 符号 〈 空 串 e) 相关 联 的 可 能 性 的 状态 。 在 这 个 例子 中 ， 起 
始 状态 是 状态 q.,，， 因 为 0 是 偶数 。 最 后 ， 把 接受 状态 设置 为 这 
样 一 些 状 态 ， 它们 都 对 应 于 自动 机 打算 要 接受 输入 字符 串 的 可 能 
性 。 令 gj 为 接受 状态 ， 因 为 当 看 到 奇数 个 1 时 就 打算 要 接受 。 图 1-12 增加 起 始 状态 
这 些 添 加 的 内 容 在 图 1- 12 中 给 出 。 和 接受 状态 

本 例 说 明 如 何 设计 有 穷 自动 机 E。 ， 使 其 能 识别 含有 001 作为 子 串 的 所 有 字 
符 串 组 成 的 正则 语言 。 例 如 ，0010，1001，001 和 11111110011111 都 在 这 个 语言 中 ， 而 
11 和 0000 则 不 在 这 个 语言 中 。 如 果 设 计 者 是 E, ， 他 会 怎样 识别 这 个 语言 呢 ? 当 符 号 一 个 
接 一 个 地 到 来 时 ， 他 开始 可 能 要 跳 过 所 有 的 1。 如 果 得 到 一 个 0， 那 么 注意 到 ， 他 此 时 可 
能 刚刚 看 见 所 要 寻找 的 模式 001 中 的 第 一 个 符号 。 如 果 接 着 看 见 一 个 1， 由 于 0 的 个 数 不 
够 ， 所 以 返回 去 跳 过 1。 但 是 ， 如 果 接 着 看 见 一 个 0， 则 应 该 记 住 已 经 看 见 模式 的 两 个 符 
号 。 现 在 只 需要 继续 扫描 直到 看 见 一 个 1 为 止 。 如 果 找 到 1， 那 么 记 住 已 经 成 功 地 找到 模 
式 001， 并 且 继 续 读 完 输入 字符 串 。 

因此 ， 有 4 种 可 能 性 : 

1. 刚才 没有 看 见 模 式 的 任何 符号 。 
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2. 刚才 看 见 一 个 0。 

3. 刚才 看 见 00. 

4. 已 经 看 见 整 个 模式 001, 

用 状态 d+ A+ do 和 doo 分 别 表示 这 4 种 可 能 性 。 通 过 下 述 观 察 可 以 给 出 所 有 的 转移 : 
在 g 读 到 1 时 仍 停 在 g 而 读 到 0 时 转移 到 qo; 在 go 读 到 1 时 返回 到 9 而 读 到 0 时 转移 到 
qoo; TE Qo EEN 1 时 转移 到 goo, 而 读 到 0 时 仍 停留 在 goo; 最 后 ， 在 gool 读 到 0 或 1 时 都 停 
FATE doo, 。 起 始 状态 是 g， 唯 一 的 接受 状态 是 oo WE 1- 13 Prom. 


0,1 





图 1-13 接受 含有 001 的 字符 串 a 


1.1.5 正则 运算 


在 前 两 个 小 节 中 我 们 介绍 并 定义 了 有 穷 自动 机 和 正则 语言 ， 现 在 开始 考察 它们 的 性 
质 。 这 些 工 作 有 助 于 开发 一 个 工具 箱 ， 它 提供 在 设计 识别 特定 语言 的 有 穷 自动 机 时 需要 的 
技术 。 工 具 箱 还 包括 证 明 某 些 其 他 语言 不 是 正则 语言 ( 即 ， 超 出 了 有 穷 自 动机 的 能 力 ) 的 

在 算术 中 ， 基 本 对 象 是 数 ， 工 具 是 处 理 数 的 运算 ， 如 十 和 xX。 在 计算 理论 中 ， 对 和 象 是 
语言 ， 工 具 包 括 为 处 理 语言 专门 设计 的 运算 。 定 义 语言 的 三 种 运算 ， 称 为 正则 运算 
(regular operation) ， 并 且 使 用 这 些 运算 来 研究 正则 语言 的 性 质 。 

设 A 和 已 是 两 个 语言 ， 定 义 正 则 运算 并 (union)、 连 接 (concatena- 
tion) 和 星 号 (star) w F: 

。 并: AUB={z|xEAKXxrEB} 

。 连接 : A。B 二 {xy|x€EA 且 y€B) 

。 BB, A* =(2122°"2,|k20 且 每 一 个 zi EA) 

大 家 对 并 运算 已 经 很 熟悉 ， 它 把 A 和 B 中 的 所 有 字符 串 合 并 在 一 个 语言 中 。 

连接 运算 有 点 小 花招 。 它 以 所 有 可 能 的 方式 ， 把 A 中 的 一 个 字符 串 接 在 B 中 的 一 个 
字符 串 的 前 面 ， 得 到 新 的 语言 中 的 全 部 字符 串 。 

星 号 运算 与 前 两 个 运算 有 点 不 同 ， 因 为 它 作 用 于 一 个 语言 而 不 是 两 个 语言 。 亦 即 ， 星 
号 运算 是 一 元 运算 (unary operation) 而 不 是 二 元 运算 (binary operation)。 它 把 A 中 的 
任意 个 字符 串 连 接 在 一 起 得 到 新 语言 中 的 一 个 字符 串 。 因 为 “任意 个 ”包括 0 个 在 内 ， 所 
以 不 管 A RITA, ZEP e 总 是 A* 的 一 个 成 员 。 

CEED ” 设 字母 表 卫 是 标准 的 26 个 字母 {a,b,…,z}。 又 设 A= (good, bad}, B= 
{boy,girl}, 2 

AU B=({good, bad, boy, girl}, 

AeB=({goodboy, goodgirl, badboy, badgirl}, 

A* ={e, good, bad, goodgood, goodbad, badgood, badbad, 
goodgoodgood, goodgoodbad, goodbadgood, goodbadbad, ，…} w 


设 N= 二 {1,2,3,…}) ERRAR. W N 在 乘法 运算 下 封闭 的 意思 是 ， 对 N PERN x 
和 y， 乘 积 xXy 也 在 N 中 。 相 反 地 ，NN 在 除法 下 不 是 封闭 的 ， 因 为 1 和 2 在 N 中 ,而 1/ 
2 不 在 N 中 。 一 般 说 来 ， 如 果 把 某 种 运算 应 用 于 一 个 对 象 集合 的 成 员 得 到 的 对 象 仍 在 这 个 
集合 中 ， 则 称 这 个 对 象 集合 在 该 运算 下 封闭 。 下 面 证 明正 则 语言 类 在 三 种 正则 运算 下 封 
闭 。 在 1.3 节 将 会 看 到 这 些 封 闭 性 对 于 处 理 正 则 语言 和 和 了解 有 穷 自动 机 的 能 力 是 有 用 的 工 
具 。 AIG 从 证 明 并 运算 开始 。 

正则 语言 类 在 并 运算 下 封闭 。 

换言之 ， 如 果 A fe Ap 是 正则 语言 ， 则 A UA: 也 是 正则 语 

证 明 思 路 有 两 个 正则 语言 Al 和 A;， 要 证 明 Ai UA? 也 是 正则 的 ， 由 于 A MA E 
正则 的 ， 所 以 有 一 台 有 穷 自 动机 Mi 识别 Ai 和 一 台 有 穷 自动 机 Me 识别 Az. A SUE A 
UA: 是 正则 的 ， 因 而 要 证 明 有 一 台 有 穷 目 动 机 识别 A UA;， 把 它 称 为 M。 

这 是 一 个 构造 性 证 明 。 利 用 Mi 和 Me 构造 M。 为 了 识别 并 语言 A UA, Blak M 必 
须 恰 好 在 Mi 或 Me 接受 的 时 候 接 受 它 的 输入 串 。M 模拟 Mi 和 Ms 并 且 当 这 两 个 模拟 中 
有 一 个 接受 时 ，M 接受 。 

Plas M 怎样 模拟 M, 和 Ms YE? 它 可 能 是 先 在 输入 上 模拟 Mi ， 然 后 再 在 输入 上 模拟 
M2z 。 但 是 ， 在 这 里 必须 小 心 ! 一 旦 输入 中 的 符号 被 读 过 且 用 于 模拟 Mi ， 就 不 可 能 为 了 模 
WM: “把 输入 市 重新 绕 回 去 ”。 因 而 需要 用 另外 的 方法 。 

设计 者 可 以 设想 目 己 就 是 M。 当 输入 符号 一 个 接 一 个 地 来 到 时 ， 同 时 模拟 Mi 和 M2, 
但 只 能 经 过 输入 串 一 次 。 但 是 ， 能 够 用 有 穷 的 存储 同时 记 住 两 个 模拟 吗 ? 需要 记 住 的 全 部 
内 容 是 ， 当 每 一 台 机 器 读 到 输入 字符 串 的 这 个 地 方 时 ， 它 会 处 在 什么 状态 。 因 此 需要 记 住 
一 对 状态 。 可 能 会 有 多 少 对 状态 ? WR Mi A ki TAIRA, Mm 有 ke 个 状态 ， 那 么 一 共有 
ki Xko 对 状态 ， 其 中 一 个 状态 来 自 Mi ， 另 一 个 状态 来 自 Ms 。 这 个 数目 将 是 M 的 状态 数 ， 
Mi 和 Ms 的 一 对 状态 是 M 的 一 个 状态 。M 的 转移 从 一 对 状态 到 一 对 状态 ， 同 时 修改 M: 
和 M2 当前 的 状态 。 当 Mi 或 Mz 的 状态 是 接受 状态 时 ， 这 对 状态 是 M 的 接受 状态 。 

WEAR 设 Mi 识别 Al，M; 识别 Al, H 

My = (Qi 5901 9g) oF 1) M3 = (Q2 202g F2) 
构造 识别 A UA: 的 M， 这 里 M=., qF). 

1.Q=((rnisr2d|nE€Q HrEQ). RS QEL IQ HHEILA, PE Qi XQ. 
它 是 第 一 个 元 素 取 目 Qi 、 第 二 个 元 素 取 上 自 Q: 的 所 有 的 状态 有 序 对 组 成 的 集合 。 

2. FHER Z, 5M., M 的 字母 表 相同 。 在 这 个 定理 以 及 随后 所 有 类 似 的 定理 中 ， 为 
简单 起 见 ， 假 设 M 和 M 有 相同 的 输入 字母 表 王 。 如 果 它 们 有 不 相同 的 字母 表 2 和 z, 
定理 仍然 成 立 。 不 过 要 修改 证 明 。 令 z=% UX. 

3. 转移 函数 6 定义 如 下 : 对 每 一 对 (ri ,rs) EQ 和 每 一 个 aE€53, 令 

OCC sr2) 5a) = (0 Cri sa) 502 (re ,a)) 
FE., ORM 的 一 个 状态 〈 它 实际 上 是 取 目 M 和 Ms: 的 一 对 状态 ) 和 一 个 输入 符号 ， 返 
回 M 的 下 一 个 状态 。 
4. qo 是 有 序 对 (di> q2)。 
5 下 等 于 有 一 个 元 素 是 Mi 或 Mz 的 接受 状态 的 有 序 对 组 成 的 集合 。 它 可 以 写成 
F=((ri5r2) |r € Fi r EF)? 
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这 个 表达 式 与 下 =(CF XQ2)U(Q XF:) Al. CER: ES F=F XF: 不 同 。 这 个 表达 
式 能 给 我 们 提供 什么 呢 ?)S 

FIE, HERI A UA: 的 有 穷 自 动机 M 的 工作 已 经 完成 。 这 个 构造 相当 简单 ， 因 而 
根据 在 证 明 思路 中 描述 的 策略 ， 它 的 正确 性 是 显然 的 。 更 复杂 的 构造 要 求 增加 证 明正 确 性 
的 讨论 。 通 常 采 用 归纳 法 形式 地 证 明 这 类 构造 的 正确 性 。 作 为 一 个 例子 ， 请 看 定理 1. 28 
的 证 明 。 本 课程 中 大 多 数 这 类 构造 都 相当 简单 ， 因 而 不 需要 形式 化 的 正确 性 证 明 。 B 

刚才 证 明了 两 个 正则 语言 的 并 集 是 正则 的 ， 因 而 证 明正 则 语言 类 在 并 运算 下 封闭 。 接 
下 来 转 到 连接 运算 ， 并 且 试 着 证 明正 则 语言 类 在 该 运算 下 也 封闭 。 

正则 语言 类 在 连接 运算 下 封闭 。 

换言之 ， 如 果 Al 和 As 是 正则 语言 ， 则 A ° A: 也 是 正则 语言 。 

为 了 证 明 这 个 定理 ， 让 我 们 按照 关于 并 运算 下 封闭 的 证 明 线 索 试 一 试 。 和 前 面 一 样 ， 
从 假设 有 穷 自动 机 Mi 和 Me 分 别 识别 正则 语言 A 和 As 开始 。 但 是 ， 现 在 设计 的 有 穷 自 
动机 M 不 是 当 Mi 或 Mi 接受 输入 时 它 才 接 受 输入 ， 而 应 该 是 当 它 的 输入 可 以 被 分 成 两 
E, Mi 接受 第 一 段 且 M: 接受 第 二 段 时 ，M 才 接 受 输入 。 问 题 是 M 不 知道 在 什么 地 方 把 
它 的 输入 分 开 〈 即 在 什么 地 方 第 一 段 结 束 和 第 二 段 开 始 )。 为 了 解决 这 个 问题 ， 引 入 所 请 
非 确定 性 的 新 技术 。 


1.2 非 确定 性 


非 确定 性 是 一 个 有 用 的 概念 ， 已 经 对 计算 理论 产生 了 巨大 的 影响 。 至 今 在 我 们 的 讨论 
中 ， 计 算 的 每 一 步 都 按照 唯一 的 方式 跟 在 前 一 步 的 后 面 。 当 机 器 处 于 给 定 的 状态 并 读 人 下 
一 个 输入 符号 时 ， 可 以 知道 机 器 的 下 一 个 状态 是 什么 一 一 它 是 确定 的 。 因 此 ， 称 这 是 确定 
型 计算 (deterministic computation) 。 在 非 确定 型 (nondeterministic) 机 器 中 ， 在 任何 一 
尽 ， 下 一 个 状态 可 能 存在 奉 干 个 选择 。 

非 确 定性 是 确定 性 的 推广 ， 因 此 每 一 台 确 定型 有 穷 自 动机 自动 地 是 一 台 非 确定 型 有 穷 
目 动 机 。 如 图 1- 14 所 示 ， 非 确定 型 有 穷 自 动机 可 能 有 一 些 另外 的 特征 。 





图 1-14 非 确 定型 有 穷 自动 机 Ni 


确定 型 有 穷 自动 机 (简称 DFA) 与 非 确定 型 有 穷 自动 机 (简称 NFA) 之 间 的 区 别 是 
显而易见 的 。 第 一 ，DFA 的 每 一 个 状态 对 于 字母 表 中 的 每 一 个 符号 总 是 恰好 有 一 个 转移 
箭头 射出 。 图 1- 14 中 给 出 的 非 确定 型 自动 机 违背 了 这 条 规则 。 状 态 q 对 于 0 有 一 个 射出 
Wak, MF 有 两 个 射出 的 箭头 ; gq, 对 于 0 有 一 个 箭头 ， 而 对 于 1 没有 箭头 。 在 
NFA 中 ， 一 个 状态 对 于 字母 表 中 的 每 一 个 符号 可 能 有 0 个 、1 个 或 多 个 射出 的 箭头 。 

第 二 ,在 DFA 中 ， 转 移 箭 头 上 的 标号 是 取 自 字母 表 的 符号 。NEFA Ni 有 一 个 带 有 标 


O 这 个 表达 式 把 M 的 接受 状态 定义 为 两 个 元 素 都 是 接受 状态 的 有 序 对 。 在 这 种 情况 下 ，M 接受 一 个 字符 串 仅 当 
M: 和 M: 都 接受 这 个 字符 串 ， 因 此 产生 的 语言 是 交集 ， 而 不 是 并 集 。 事 实 上 ， 这 个 结果 证 明正 则 语言 类 在 交 
运算 下 封闭 。 


号 s 的 箭头 。 一 般 地 说 ，NFA 的 箭头 可 以 标记 字母 表 中 的 符号 或 s。 从 一 个 状态 可 能 射出 
0 个 、1 个 或 多 个 带 有 标号 es 的 箭头 。 

NFA 如 何 进行 计算 ? 假设 一 台 NFA 正在 对 一 个 输入 串 运 行 ， 它 能 以 多 种 行进 方式 到 
达 一 个 状态 。 例 如 ，NFA Ni 处 于 状态 qi ， 下 一 个 输入 符号 是 1。 在 读 和 人 这 个 符号 后 ， 机 
器 把 自己 复制 成 多 个 备份 ， 并 且 并 行 地 执行 所 有 的 可 能 性 。 机 器 的 每 一 个 备份 采用 一 种 可 
能 的 方式 进行 ， 并 且 像 前 面 一 样 继续 下 去 。 如 果 随 后 又 有 多 种 选择 ， 机 占 将 再 次 分 裂 。 对 
于 机 器 的 一 个 备份 ， 如 果 下 一 个 输入 符号 不 出 现在 它 所 处 的 状态 射出 的 任何 箭头 上 ， 则 机 
器 的 这 个 备份 及 其 相关 联 的 计算 分 支 一 块 死 掉 。 最 后 ， 如 果 机 器 的 某 一 个 备份 在 输入 的 末 
端 处 在 接受 状态 ， 则 这 人 台 NFA 接受 输入 字符 串 。 

如 果 遇 到 一 个 状态 ， 在 射出 的 箭头 上 标 有 ss， 发 生 的 情况 类 似 。 不 用 读 任 何 输入 ， 机 
器 分 裂 成 多 个 备份 ， 每 一 个 标记 s 的 射出 箭头 有 一 个 备份 跟踪 ， 还 有 一 个 备份 停留 在 当前 
状态 。 然 后 机 器 和 前 面 一 样 非 确 定性 地 运行 。 

可 以 把 非 确 定性 看 作 是 若干 独立 的 “过 程 ” 或 “线程 ”>， 即 能 同时 运行 的 一 类 并 行 计 
算 。 当 NFA 分 头 跟 踪 者 干 选择 时 ， 这 对 应 于 一 个 过 程 “ 分 又 ”成 春 干 子 过 程 ， 各 个 子 过 
程 分 别 地 进行 。 如 果 这 些 子 过 程 中 至 少 有 一 个 接受 ， 那 么 整个 计算 接受 。 

另 一 种 方法 是 把 非 确定 型 计算 看 作 一 棵 可 能 性 的 树 。 树 根 对 应 计算 的 开始 ， 树 中 的 每 
一 个 分 支点 对 应 计算 中 机 器 有 多 种 选择 的 点 。 如 果 计 算 分 支 中 至 少 有 一 个 结束 在 接受 状 
态 ， 则 机 豆 接 受 ， 如 图 1- 15 Pra. 

考虑 图 1- 14 给 出 的 NFA Ni 的 运行 。 图 1- 16 描绘 了 Ni 关于 输入 010110 的 计算 。 





确定 型 计算 非 确定 型 计算 
.开始 
i. f 4 
| ny 
{ ogy 
‘ paf y 
i 
LE " 接受 
图 1- 15 有 一 个 接受 分 支 的 确定 型 计算 和 非 确定 型 计算 图 1- 16 Ni 关于 输入 010110 的 计算 


对 于 输入 010110， 从 起 始 状态 q 开始 ， 读 第 一 个 符号 0。 对 于 0， 从 9 出 发 只 有 一 
个 地 方 能 去 ， 即 回 到 gq ， 所 以 保持 不 动 。 接 着 读 第 二 个 符号 1。 对 于 1]，g， 有 两 种 选择 : 
或 者 停留 在 q; ， 或 者 移 到 gq, 。 对 非 确 定型 ， 机 器 分 裂 成 两 个 ， 分 头 跟 踪 每 一 种 选择 。 为 
了 记 住 可 能 处 于 哪些 状态 ， 在 机 器 的 每 一 个 可 能 的 状态 上 放 一 个 手指 。 因 此 现在 把 手指 放 
ERS q Mg 上 。 有 一 个 es 箭头 离开 状态 go, ， 故 机 器 再 次 分 裂 : 一 个 手指 留 在 g, ， 另 一 
个 手指 移 到 gs; 。 现 在 ， 在 qi ，g, Ma, 上 都 有 手指 。 

当 读 第 三 个 符号 0 时， 返回 来 看 每 一 个 手指 。g， 上 的 手指 保持 不 动 ，q 上 的 手指 移 
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到 q;， 并 且 把 原来 在 qg 上 的 手指 拿 掉 。 原 来 在 q; 上 的 手指 没有 0 箭头 能 沿 着 走 ， 这 对 应 
一 个 完全 “ 死 掉 ”的 过 程 。 此 时 ， 在 状态 q Aa, 上 有 手指 。 

当 读 第 四 个 符号 1 时 ,在 qi 上 的 手指 分 裂 成 在 状态 g, 和 状态 g9 上 的 手指 ， 然 后 在 9， 
上 的 手指 进一步 分 裂 出 一 个 手指 沿 着 e 箭头 到 达 q; MEg 上 的 手指 移动 到 q MEE 
四 个 状态 上 都 有 手指 。 

和 读 第 四 个 符号 一 样 ， 当 读 第 五 个 符号 1 时 ,在 gq, Ma, 上 的 手指 变 成 在 状态 A> Q, 
q, Ag, 上 的 手指 。 在 状态 qg 上 的 手指 被 移 开 ， 在 9g, 上 的 手指 留 在 9 LAD. WEE q 
上 有 两 个 手指 ， 所 以 移 开 一 个 ， 因 为 在 此 刻 只 需要 记 住 g, 是 一 个 可 能 的 状态 ， 而 不 需要 
记 住 有 多 少 理由 使 它 成 为 可 能 的 状态 。 

当 读 第 六 个 也 是 最 后 一 个 符号 0 时， 在 gq， 上 的 手指 原 地 不 动 ， 在 g 上 的 手指 移 到 q, 
上 ， 移 开 原 来 在 q 上 的 手指 ， 在 9 上 的 手指 留 在 原 地 不 动 。 现 在 已 经 到 达 字 符 串 的 末 
端 ， 如 果 有 某 只 手指 在 一 个 接受 状态 上 ， 则 接受 该 字符 串 。 现 在 ， 在 状态 qr g Aa, 上 
都 有 手指 ， 由 于 gq, 是 一 个 接受 状态 ， 所 以 Ni 接受 这 个 字符 串 。 

Ni 对 输入 010 做 些 什 么 ? 开始 时 把 一 个 手指 放 在 q; 上 。 读 0 之 后 仍然 只 在 aq 上 有 一 
个 手指 ， 而 在 读 1 之 后 在 gq; 、q, 和 gs 上 有 和 手指 (不 要 忘记 e 箭头)。 在 读 第 三 个 符号 0 之 
In» BA g; 上 的 手指 ， 把 q 上 的 手指 移 到 qg Eo RE q 上 的 手指 不 动 。 此 时 已 经 在 输 
人 串 的 末端 ， 由 于 在 接受 状态 上 没有 手指 ， 所 以 Ni 拒绝 这 个 输入 。 

继续 以 这 种 方式 试验 ， 可 以 发 现 Ni 接受 所 有 含 101 或 11 作为 子 串 的 字符 串 。 

非 确定 型 有 穷 自 动机 在 奉 干 方面 都 是 有 用 的 。 正 如 我 们 将 要 证 明 的 那样 ， 每 一 人 台 
NFA 都 可 以 转换 成 一 台 等 价 的 DFA， 而 构造 NFA 有 时 比 直接 构造 DFA 容易 。 一 台 NFA 
可 能 比 与 它 等 价 的 DFA 小 很 多 ,或 者 它 的 功能 更 易于 理解 。 由 于 有 穷 自 动机 特别 容易 理 
解 ， 有 穷 自动 机 的 非 确 定性 也 是 对 能 力 更 强 的 计算 模型 的 非 确 定性 的 一 个 很 好 的 引入 。 现 
在 来 看 几 个 NFA 的 例子 。 

Cee ZAE (0,1) 上 倒数 第 三 个 符号 为 1 的 所 有 字符 串 组 成 的 语言 (例如 ， 
000100 Æ A Ħ}, mi 0011 AEA), Al 1-17 所 示 的 4- 状 态 NFA N: 识别 A。 


hea 
OOO"© 


图 1-17 识别 A 的 NFA N: 


观察 这 台 NFA 的 计算 的 一 个 好 方法 是 让 它 停 在 起 始 状 态 q., HIE FAR” CEY 
位 于 倒数 第 三 的 位 置 上 。 这 时 ， 如 果 输 入 符号 
是 1， 那 么 它 移 到 分 支 状态 qg, HHEH q, 和 
q, “验证” 它 的 猜想 是 否 正确 。 

正如 前 面 讲 过 的 ， 每 一 台 NFA 都 可 以 转 
换 成 一 台 等 价 的 DFA， 不 过 有 时 那 台 DFA 的 
状态 可 能 会 多 很 多 。 关 于 语言 A 的 最 小 DFA 
含有 8 个 状态 。 而 且 可 能 发 现 ， 通 过 考察 图 1- 
18 中 的 DFA， 更 容易 理解 NFA 的 功能 。 图 1-18 一 台 识 别 A 的 DFA 
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假设 在 图 1- 17 的 机 器 N: 中 ， 在 从 q, Bla, 和 从 gs Za, 的 箭头 上 的 标号 中 添加 e. 
亦 即 ， 这 两 个 箭头 的 标号 是 0、1、s， 而 不 仅仅 是 0、1。 在 做 了 这 样 的 改动 之 后 ，Ns 能 
识别 什么 样 的 语言 呢 ? 试 试 修改 图 1- 18 中 的 DFA， 使 它 也 能 识别 这 个 语言 。 

考虑 图 1- 19 中 的 NFA Nas ， 它 的 输入 字母 表 (0) 由 一 个 符号 组 成 。 只 含 一 
个 符号 的 字母 表 称 为 一 元 字母 表 (unary alphabet). 

这 台 机 器 说 明了 有 e 箭头 的 方便 之 处 。 它 接受 所 
有 形 如 0* 的 字符 串 ， 其 中 & 是 2 或 3 的 倍数 (注意 上 
标 表 示 重 复 ， 不 是 数值 的 指数 )。 例 如 ，Ns 接受 字符 
$ s,00 ,000 ,0000 或 000000， 而 不 接受 0 和 00000, 

考虑 该 机 器 的 运行 方式 : 开始 时 猜想 是 要 验证 2 
的 倍数 还 是 3 的 倍数 ， 从 而 分 支 到 上 面 的 循环 或 下 面 
的 循环 ， 然 后 验证 猜想 是 否 正确 。 当 然 ， 可 以 用 一 人 台 
RA ce 箭头 的 机 器 ， 甚 至 是 一 台 完 全 没有 任何 非 确定 
PERN OLE SX ALE. (FE, WRIA KALE 
是 最 容易 理解 的 。 w 

CRED 图 1-20 给 出 了 NFA 的 另 一 个 例子 。 
运行 这 人 台 机 震 ， 将 会 看 到 它 接受 字符 串 e，a，baba 
和 baa, Ii ARS SFB b, bb 和 babba。 在 后 面 我 
们 会 用 这 人 台 机 器 阐明 把 NFA 转换 成 DFA 的 过 程 。 m 


1.2.1 非 确定 型 有 穷 目 动机 的 形式 化 定义 


非 确 定型 有 穷 自 动机 的 形式 化 定义 和 确定 型 有 穷 
自动 机 的 形式 化 定义 类 似 ， 它 们 都 有 状态 集 、 输 入 字母 表 、 转 移 孔 数 、 起 始 状 态 以 及 接受 状 
态 集 。 然 而 ， 它 们 在 本 质 上 是 不 同 的 一 一 转移 孙 数 的 类 型 不 同 。 在 DFA 中 ， 转 移 孔 数 取 一 
个 状态 和 一 个 输入 符号 ， 产 生 下 一 个 状态 。 在 NFA 中 ， 转 移 函 数 取 一 个 状态 和 一 个 输入 符 
号 或 者 空 串 ， 产 生 可 能 的 下 一 个 状态 的 集合 。 为 了 书写 这 个 形式 化 定义 ， 需 要 引入 某 个 额外 
的 符号 ， 对 任意 的 集合 Q,， 记 PQ) 为 Q 的 所 有 子 集 组 成 的 集合 。 这 里 称 PA BQH 
集 (power set), ${ERN SERS, {4E 5U {e} WIE 5。 现在 可 以 容易 地 写 出 NFA 中 这 种 类 
型 的 转移 子 数 的 形式 化 定义 ， 它 是 8:QXE3. 一 P(Q) 。 下 面 给 出 NFA 的 形式 化 定义 。 

(CR 天 东非 确定 型 有 穷 自 动机 是 一 个 5 元 组 (Q,5,6,q。 F), ŽP 

1.Q 是 有 穷 的 状态 集 ; 

2. 王 是 有 穷 的 字母 表 ; 

3.8:QX3.>P(Q) 是 转移 函数 ; 

4. qo EQ 是 起 始 状 态 ; 

5. FCQ 是 接受 状态 集 。 

Ga 回想 一 下 NFA Ni: 


0, 1 0, 1 
Ë 





K 1-20 NFA N, 
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Ni 的 形式 化 描述 是 (Q,5,6,g, F), HP 
1. Q 一 (ql ,qz ,93 ,94)， 

2.2 =10,1}, 

3.6 由 下 表 给 出 : 





4.q, 是 起 始 状 态 ， 

9 F= gr, a 

NFA 计算 的 形式 化 定义 也 和 DFA 计算 的 形式 化 定义 类 似 。 设 N=(Q,z,0,qo,F) 是 
一 台 NFA，w 是 字母 表 上 的 一 个 字符 串 。 如 果 能 把 w BR w= yy ym, AEGA 
yi ED. 的 一 个 成 员 ， 并 且 存 在 Q 中 的 状态 序列 ro ,ri ,，… ,rm 满足 下 述 3 个 条 件 : 

lL. a @, 

Z. iti CO Uris viti1)s 10. 1s =e, m1 

3. rmEF 
WW AK N Zw. 

条 件 1 说 机 器 从 起 始 状态 开始 。 条 件 2 说 状态 rir E N 在 状态 ri 读 到 yi;+1 时 允许 
的 下 一 个 状态 。 注 意 到 6(r; ,yi+l) 是 允许 的 下 一 个 状态 的 集合 ， 所 以 ri+1 是 这 个 集合 的 
一 个 成 员 。 最 后 ， 条 件 3 说 如 果 最 后 的 状态 是 一 个 接受 状态 ， 则 机 器 接受 它 的 输入 。 


1.2.2 NFA 5 DFA 的 等 价 性 


确定 型 和 非 确定 型 有 穷 自动 机 识别 相同 的 语言 类 。 这 个 等 价 性 既 出 人 意料 、 又 是 有 用 
的 。 说 它 出 人 意料 是 因为 NFA 好 像 比 DFA 的 能 力 强 ， 因 此 猜想 NFA 能 够 识别 更 多 的 语 
。 说 它 是 有 用 的 是 因为 对 于 给 定 的 语言 ， 描 述 识别 这 个 语言 的 NFA 有 时 比 描述 识别 这 
个 语言 的 DFA 要 容易 些 。 

如 果 两 台 机 器 识别 同样 的 语言 ， 则 称 它们 是 等 价 的 。 

每 一 台 非 确定 型 有 穷 自 动机 都 等 价 于 某 一 台 确 定型 有 穷 自 动机 。 

证 明 思路 ” 设 一 个 语言 被 一 台 NFA 识别 ， 那 么 必须 证 明 还 存在 一 台 DFA 也 识别 这 个 
语言 。 基 本 想法 是 把 NFA 转换 成 模拟 它 的 DFA. 

回想 设计 有 穷 自动 机 的 “读者 即 自动 机 ”策略 。 如 果 设 计 者 是 一 台 DFA， 会 怎样 模 
拟 这 台 NFA 呢 ? 在 处 理 输入 串 的 过 程 中 ， 需 要 记 住 什么 ? 在 NFA 的 几 个 例子 中 ， 在 输 
入 的 给 定点 把 手指 放 在 每 一 个 可 能 处 在 活动 的 状态 上 ， 用 这 种 方式 记 住 各 个 计算 分 支 。 
按照 NFA 的 运行 方式 移动 、 增 加 和 移 开 手指 。 需 要 记 住 的 全 部 信息 是 放 着 手指 的 状态 
的 集合 。 

itk E NFA 的 状态 数 ， 则 它 有 2 个 状态 子 集 。 每 一 个 子 集 对 应 模拟 这 台 NFA 的 
DFA 必须 记 住 的 一 种 可 能 性 ， 所 以 这 台 DFA 将 会 有 2* 个 状态 。 还 需要 给 出 这 台 DFA 的 
起 始 状 态 和 接受 状态 以 及 它 的 转移 函数 。 引 入 一 些 形式 化 记号 会 使 讨论 变 得 容易 些 。 


Dil 
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证 明 i N=(Q,z,0,qo,F) 是 识别 语言 A 的 NFA， 要 构造 一 台 DFA M 识别 A。 在 
给 出 完整 的 构造 之 前 ， 先 考虑 比较 容易 的 情况 ,假设 N 没有 e 箭头 ， 以 后 再 把 s 箭头 考虑 
进来 。 

构造 一 台 识 别 语言 A 的 DFA M =(Q’,5,6'.q,'.F’). 

1. Q =P(Q). 

M 的 每 一 个 状态 是 NN 的 状态 的 一 个 集合 。P(Q) 是 Q 的 所 有 子 集 组 成 的 集合 。 

2. 对 于 REQ MaE, 令 6(R,a) 二 {gE€EQ| 存 在 rER, 使 得 gE€E6(r,a)}。 如 果 尺 是 
M 的 一 个 状态 ， 则 它 是 NN 的 状态 的 一 个 集合 。 当 MERSER 读 符 号 a 时 ，6 (CR,a) 给 出 
a 把 R 中 的 状态 带 到 什么 地 方 。 由 于 每 一 个 状态 可 以 转移 到 一 个 状态 集合 ， 所 以 取 所 有 这 
些 集合 的 并 。 这 个 表达 式 可 以 用 另 一 种 方式 写成 (Ria) = Uda) , 记号 Uara) 的 


含义 是 : 对 R 中 的 所 有 元 素 r 集合 6(r,a) 的 并 集 。 

3. go ={qQy} o 

M 开始 时 所 在 的 状态 对 应 于 只 含 N 的 起 始 状态 的 集合 。 

4. 下 一 (REQ |R BE N 的 一 个 接受 状态 ) 

如 果 此 时 在 N 的 可 能 状态 中 有 一 个 接受 状态 ， 那 么 机 器 M 接受 。 

现在 考虑 es 箭头， 为 此 再 引入 一 位 记号 。 对 于 M 的 任意 一 个 状态 R， 定 义 E(R) 为 从 
R 的 成 员 出 发 只 沿 着 es 箭头 可 以 达到 的 状态 集合 ， 包 括 R 本 身 的 所 有 成 员 在 内 。 形 式 地 ， 
对 于 RCQ, $ 

ECR) 一 {q| 从 尺 出 发 沿 着 0 个 或 多 个 se 箭头 可 以 到 达 q) 
然后 修改 M 的 转移 函数 ， 使 得 在 每 一 步 之 后 ， 在 沿 着 s 箭头 可 以 达到 的 所 有 状态 上 也 放 上 
手指 。 用 E(O(r,a)) 代替 SCr,a) 能 产生 这 个 效果 。 于 是 
e (R,a) 二 {gEQ| 存 在 rER, 使 得 gE€ EE(6(r,a)))} 

此 外 还 需要 修改 M 的 起 始 状 态 ， 使 得 开始 时 把 手指 移 到 从 N 的 起 始 状态 出 发 沿 着 s 
箭头 可 以 到 达 的 所 有 状态 上 。 将 go 改 成 EC(q,}) 能 产生 这 个 效果 。 这 样 就 完成 了 模拟 
NFA N 的 DFA M 的 构造 。 

M 的 构造 显然 是 正确 的 。 在 计算 的 每 一 步 ，M 进入 的 状态 明显 地 对 应 于 N 此 时 可 能 
处 于 的 状态 子 集 。 证 毕 。 x 

定理 1.19 说 明 每 一 台 NFA 都 能 够 被 转换 成 一 台 与 其 等 价 的 DFA。 于 是 ， 非 确定 型 
有 穷 自动 机 给 出 另 一 种 刻画 正则 语言 的 方式 。 这 一 事实 陈述 为 定理 1. 19 的 一 个 推论 。 

Eee 一 个 语言 是 正则 的 ， 当 且 仅 当 有 一 台 非 确定 型 有 穷 自 动机 识别 它 。 

“ 当 目 仅 当 ” 的 一 个 方向 是 说 ， 如 果 有 一 台 NFA 能 识别 这 个 语言 ， 则 它 是 正则 的 。 定 
理 1. 19 表明 ， 任 何 一 台 NFA 都 能 够 被 转换 成 一 台 等 价 的 DFA， 因 此 如 果 有 一 台 NFA 识 
别 这 个 语言 ， 那 么 也 有 一 台 DFA 识别 它 ， 从 而 这 个 语言 是 正则 的 。 另 一 个 方向 是 说 ， 仅 
当 有 一 台 NFA 识别 这 个 语言 时 该 语言 才 是 正则 的 。 即 ， 如 果 一 个 语言 是 正则 的 ， 则 一 定 
有 一 台 NFA 识别 它 ， 这 显然 成 立 ， 因 为 每 一 个 正则 语言 都 有 一 台 识 别 它 的 DFA， 而 任 一 
台 DFA 也 是 一 台 NFA, 

用 例 1. 16 中 的 机 器 Ns 来 说 明定 理 1.19 给 出 的 把 NFA 转换 成 DFA 的 过 
程 。 为 了 描述 清楚 ， 把 Ns 的 状态 重新 记 作 {1,2,3)。 于 是 ， 在 形式 化 描述 Ns = (Q, {a， 
b},6,1,{1}) 中 ， 状 态 集 Q 为 (1,2,3}, MA 1- 21 所 示 。 
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要 构造 与 N4 等 价 的 DFA D， 首 先 确定 D 的 状态 。N4 有 3 个 状态 {1,2,3}, MA D 
有 8 个 状态 ， 每 一 个 状态 对 应 于 Ns 的 一 个 状态 子 集 。 把 DD 的 每 一 个 状 
态 记 作 它 所 对 应 的 Nu 的 状态 子 集 。 于 是 ， 的 状态 集 为 

(IB ,{1},{2},{3},{1,2},{1,3},{2,3},{1,2,3}} 

HK., ME D 的 起 始 状 态 和 接受 状态 。 起 始 状 态 是 E({1})， 它 等 
于 从 1 出 发 沿 着 箭头 能 够 到 达 的 所 有 状态 加 上 1 本 号 。 有 一 个 。 HHS 
从 1 到 3,， 故 下 ((1))= 王 (1,3}。 新 的 接受 状态 集 是 所 有 包含 Ns 接受 状 
态 的 状态 子 集 ， 即 {{1},{1,2},{1,3},{1,2,3}}. 

最 后 ， 确 定 D 的 转移 函数 。D 的 任 一 个 状态 遇 到 输入 a 时 转 到 一 个 地 方 ， 遇 到 输入 b 
时 转 到 一 个 地 方 。 用 几 个 例子 说 明 安置 D 的 转移 箭头 的 过 程 。 

由 于 在 Ns 中 ， 状 态 2 遇 到 输入 a 时 转 到 2 和 3， 并 且 从 2 或 3 不 能 沿 着 e 箭头 走 得 更 
远 ， 所 以 在 D 中 ， 状 态 (2) 遇 到 输入 a 转 到 (2,3). Æ N, 中 ， 状 态 2 遇 到 输入 b 时 只 
能 转 到 状态 3， 并 且 不 能 从 3 WE e 箭头 走 得 更 远 ， 所 以 在 D 中 ， 状 态 (2) 遇 到 输入 b 时 
转 到 状态 {3}. 

由 于 在 Na 中 没有 a 箭头 从 状态 (1; 射出 ， 所 以 在 D 中 状态 (1) BBA a ERO. 
状态 (1) 遇 到 输入 b 转 到 {2}。 注 意 ， 定 理 1. 19 描述 了 跟随 每 一 个 输入 符号 后 的 s 箭头 
的 过 程 。 另 一 种 基于 在 每 一 个 输入 符号 之 前 跟随 s 箭头 的 过 程 也 行 之 有 效 ， 但 没有 在 该 例 
中 演示 。 

由 于 在 N4 中 状态 3 遇 到 输入 a 时 转 到 1， 并 且 1 又 沿 着 se 箭头 回 到 3， 所 以 状态 (3) 
遇 到 输入 a 时 转 到 (1,3}， 遇 到 输入 b 时 转 到 名 。 

因为 1 没有 用 a 箭头 指向 任何 状态 ， 2 用 a 箭头 指向 2 和 3， 并 且 2 和 3 PRA e i 
头 指向 任何 地 方 ， 所 以 状态 (1,2) 遇 到 输入 a 时 转 到 {2,3}。 状 态 (1,2) 遇 到 输入 b 时 
转 到 {2,3}. pica fata 可 以 得 到 的 状态 图 ， 如 图 1-22 frm. 





图 1-21 NFA N, 





图 1-22 5 NFA N, 等 价 的 DFAD 


通过 观察 到 没有 箭头 射 人 的 状态 (1) 和 {1,2}， 可 以 对 这 人 台 机 器 进行 简化 ， 删 掉 这 
两 个 状态 不 会 影响 机 天 的 性 能 。 这 样 做 可 以 得 到 图 1- 23。 





图 1-23 删 掉 不 需要 的 状态 后 得 到 的 DFA D n 
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1.2.3 在 正则 运算 下 的 封闭 性 


现在 回 到 在 1. 1 节 中 开始 的 正则 语言 类 在 正则 运算 下 的 封闭 性 ， 目 标 是 证 明正 则 语言 
在 经 过 并 、 连 接 以 及 星 号 运算 后 仍 是 正则 语言 。 当 时 由 于 处 理 连 接 运 算 太 复杂 ， 放 弃 了 证 
明 的 打算 。 使 用 非 确 定性 能 使 证 明 容 易 许多 。 

首先 ， 再 次 考虑 在 并 运算 下 的 封闭 性 。 前 面 在 证 明 并 运算 下 的 封闭 性 时 ， 使 用 笛 卡 
尔 积 构造 的 同时 ， 非 确定 性 地 模拟 了 两 台 机 器 。 现 在 用 一 个 新 的 证 明 来 说 明 非 确定 性 技 
术 。 重 新 看 看 原来 在 1. 1.5 中 的 证 明 可 能 是 值得 的 ， 这 能 够 让 发 现 新 的 证 明 容 易 、 直 观 
许多 。 

正则 语言 类 在 并 运算 下 封闭 。 

证 明 思 路 有 两 个 正则 语言 A 和 Ac, WEAR A UA: 是 正则 的 。 想 法 是 对 A 和 As 
RAS NFA Ni 和 Nz， 并 把 它们 合并 成 一 台新 的 NFA N., 

Ni 或 N: 接受 输入 时 ， 机 器 N 应 该 接受 这 个 输入 。 新 机 器 有 新 的 起 始 状态 ， 它 用 
e 箭头 分 支 到 原 机 器 的 起 始 状态 。 新 机 器 用 这 种 方式 非 确 定性 地 猜想 两 台 原 有 机 器 中 哪 一 
台 接 受 这 个 输入 。 如 果 它 们 两 台中 有 一 台 接 受 ， 那 么 N 也 接受 。 

图 1- 24 给 出 了 这 个 构造 。 在 图 的 左 部 ， 大 圆圈 表 
示 机 器 Ni 和 No 的 起 始 状态 以 及 接受 状态 ， 小 圆圈 表 
示 其 余 的 状态 。 在 图 的 右 部 ,说 明了 如 何 通 过 增加 转 
移 箭头 把 Ni 和 Na 合并 成 N。 

证 明 设 和 N= 二 (Qi ,5,61,91 Fi) 识别 Ai, FA 
Nz 二 (Qz ,2,62,q,，F2) 识别 A;， 构 造 识别 Ai U A2? 
的 N==(Q,3,6,g0 F). 

1.Q={q,}UQ:UQ. 

NN 的 状态 是 Ni 和 Ns 的 所 有 状态 ， 再 加 上 一 个 新 
的 起 始 状态 qu 。 

2. 状态 qu 是 NN 的 起 始 状 态 。 

3. 接受 状态 F=F, UF. 

NN 的 接受 状态 是 Ni 和 Ns 的 所 有 接受 状态 。 因 此 ， 只 要 Ni 接受 或 N 接受 ，N 就 
接受 。 

4: EM OME: 对 每 一 个 5EQ 和 每 一 个 eaE 瑟 ， 
ôı (qa) qEQı 
O2(q,a) qEQ: 
idid) @=—Gq, Hare 
D q=q H a%e m 

现在 证 明正 则 语言 类 在 连接 运算 下 的 封闭 性 。 回 想 早 些 时 候 在 没有 非 确 定性 的 情况 
下 ， 要 完成 这 个 证 明 是 有 一 定 困难 的 。 

正则 语言 类 在 连接 运算 下 封闭 。 

证 明 思 路 有 两 个 正则 语言 Al MA, ZWE A ° A 是 正则 的 。 想 法 是 取 两 台 NFA 
Ni 和 No 分 别 识 别 A 和 As ， 像 在 证 明 并 运算 封闭 时 所 做 的 那样 ， 把 它们 合并 成 一 台新 





图 1-24 识别 AlUA; 的 
NFA N 的 构造 


O(q,a) == 
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的 NFA N, 但 是 这 一 次 要 用 不 同 的 方式 ， 如 图 1- 25 Pro. 

取 六 的 起 始 状态 为 Ni 的 起 始 状 态 。Ni 的 
每 一 个 接受 状态 增加 一 个 ss 箭头， 使 得 只 要 Ni 
在 一 个 接受 状态 ， 就 允许 N 非 确定 性 地 分 支 进 入 
Nai 。 这 意味 着 它 已 经 找到 输入 的 前 一 段 ， 这 一 段 
构成 Ai 中 的 一 个 字符 串 。NN 的 接受 状态 就 是 NN， 
的 接受 状态 。 因 此 当 输 入 可 以 被 分 成 两 段 并 且 第 
一 段 被 Ni 接受 ， 第 二 段 被 N 接受 时 ，NN 接受 。 
可 以 认为 N 非 确 定性 地 猜想 在 什么 地 方 把 输入 串 
分 开 。 图 1-25 Wall Are A: 的 NN 的 构造 

证 明 Ni =(Q15250159q,5F1) 识别 Ai， 并 且 Ni 二 (Qs ,3,62 ,gq,,F2) 识别 A。， 构 
造 识别 Ai ° As 的 N= 二 (Q,3,6,g) ,F;)。 

1. Q=Q UQ. 

N 的 状态 是 Ni Al No 的 所 有 状态 。 

2. N 的 起 始 状态 是 Ni 的 起 始 状态 qo 

3. N 的 接受 状态 集 是 Ne 的 接受 状态 集 Fi. 

4 EMOMP: 对 每 一 个 gEQ 和 每 一 个 &E3， 





01 (9q,a) qEQ HBH ag 
0) (q,a) qe Fi H afe 
es ay yy Bure 
02 (qsa) qe Qe m 


正则 语言 类 在 星 号 运算 下 封闭 。 

证 明 思 路 有 一 个 正则 语言 Ai， 要 证 明 
A; 也 是 正则 的 。 取 一 台 识 别 Al K NFA N, 
如 图 1- 26 所 示 的 那样 修改 它 ， 使 其 识别 A, 。 
只 要 能 把 输入 分 成 若干 段 ， 并 且 Ni 接受 每 一 
段 ， 则 修改 后 的 NFA N 就 接受 这 个 输入 。 

可 以 这 样 构造 N; 在 Ni 上 添加 从 每 一 个 接 1-26 WRA Ar KYN BAe 
受 状态 返回 起 始 状 态 的 。 ATA. AE, MHITA Ni 能 接受 的 一 段 结 束 时 ， 机 器 N 可 以 选 
择 跳 回 起 始 状 态 试图 读 Ni 能 接受 的 下 一 段 。 此 外 还 必须 修改 N 使 其 接受 。，e 永远 是 AY 
的 成 员 。 一 个 (不 太 好 的 ) 想法 是 直接 把 起 始 状态 加 到 接受 状态 集中 。 这 个 方法 确实 把 e 
加 进 了 被 识别 的 语言 中 ， 但 是 它 也 可 能 加 进 一 些 其 他 不 想 要 的 字符 串 。 练 习 1. 15 BRA 
出 一 个 说 明 这 个 想法 不 对 的 例子 。 解 决 这 个 问题 的 办 法 是 添加 一 个 新 的 起 始 状态 ， 同 时 也 
是 一 个 接受 状态 ， 并 且 有 一 个 指向 原 起 始 状态 的 es 箭头 。 这 个 解决 方案 能 达到 期 望 的 效 
果 : 在 识别 的 语言 中 加 入 e 而 不 加 入 其 他 任何 字符 串 。 

证 明 设 和 Ni 二 (Qi,3,61,91 Fi) 识别 Ai， 构造 识别 Ar 的 N=(Q,5,0,q>F). 

下 和 一， 

N 的 状态 是 Ni 的 所 有 状态 加 一 个 新 的 起 始 状 态 Q 。 

2. qu 是 新 的 起 始 状 态 。 
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J: F={q} UFi 
接受 状态 是 原 有 接受 状态 加 新 的 起 始 状 态 。 
4, 定义 6 如 下 : 对 每 一 个 gEQ 和 每 一 个 a Ed. , 


61 (q,a) q&Qi H q¢ẸFı 
0) (qsa) qE F, H afe 
SCq,a)=4 01 Cq U lq} qEFı Hase 
{q,} q—q, H ae 
D amh, H afe i 


1.3 正则 表达 式 


在 算术 中 可 以 用 运算 符 十 和 XX 来 构造 表达 式 ， 如 (5 十 3)X4。 类 似 地 ， 可 以 用 正则 运 

算 符 构 造 描 述 语言 的 表达 式 ， 称 为 正则 表达 式 。 例 如 : 
(0U1)0" 

上 面 那 个 算术 表达 式 的 值 是 32， 而 正则 表达 式 的 值 是 一 个 语言 。 在 这 个 例子 中 ， 正 则 表达 
式 的 值 是 由 一 个 0 或 一 个 1 后 面 跟着 任意 个 0 的 所 有 字符 串 组 成 的 语言 。 和 仔细 地 分 析 这 个 
表达 式 的 各 部 分 ， 可 以 得 到 这 个 结果 。 首 先 ， 符号 0 和 1 是 集合 (0) 和 (1) 的 缩写 ， 因 
此 OUD 就 是 ({0}U {1})。 这 部 分 的 值 是 语言 {0,1}。 第 2 部 分 0* 就 是 {0}* ， 它 的 
值 是 由 所 有 包含 任意 个 0 的 字符 串 组 成 的 语言 。 其 次 ， 和 代数 中 的 符号 X 一 样 ， 在 正则 表 
达 式 中 常常 省 略 连 接 符 。。 因 此 ，(0U1)0* 实际 上 是 (0U1)。0* 的 缩写 。 连 接 运 算 把 来 
自 这 两 部 分 的 字符 串 接 在 一 起 得 到 整个 表达 式 的 值 。 

正则 表达 式 在 计算 机 科学 各 种 应 用 中 有 着 重要 的 作用 。 在 涉及 文本 的 应 用 中 ， 用 户 可 
能 要 搜索 满足 某 种 模式 的 字符 串 。 正 则 表达 式 提供 了 描述 这 种 模式 的 有 力 方法 。 应 用 程序 
(Can UNIX 中 的 awk 和 grep)、 现 代 程 序 设计 语言 (如 Perl) 以 及 文本 编辑 器 都 提供 了 用 
正则 表达 式 描 述 模式 的 机 制 。 

正则 表达 式 的 另 一 个 例子 是 

(OU1)* 

它 从 语言 OUD 开始 ， 并 且 运 用 * 运算 。 这 个 表达 式 的 值 是 由 0 和 1 的 所 有 字符 串 组 成 
的 语言 。 夺 3 二 《0,1)， 则 可 以 用 作为 正则 表达 式 (0 U1) 的 缩写 。 更 一 般 地 讲 , RS 
是 任意 的 字母 表 ， 正 则 表达 式 3 描述 该 字母 表 上 所 有 长 度 为 1 的 字符 串 组 成 的 语言 ， 而 
I 描述 该 字母 表 上 的 所 有 字符 串 组 成 的 语言 。 类 似 地 ，5* 1 是 包含 着 所 有 以 1 结尾 的 字 
符 串 的 语言 。 语 言 (03* )U(5*1) 由 所 有 以 0 开始 或 者 以 1 结尾 的 字符 串 组 成 。 # 

在 算术 中 ， 久 优先 于 十 的 意思 是 ， 当 要 在 十 和 X 中 进行 选择 时 ， 首 先 选择 X 久 运算 。 因 
此 ,在 2 十 3X4 中 先 做 3X4， 再 做 加 法 。 要 想 先 做 加 法 ， 必 须 加 括号 ， 得 到 (2 十 3) X4。 
在 正则 表达 式 中 ， 先 做 星 号 运算 ， 然 后 做 连接 运算 ， 最 后 做 并 运算 ， 除 非 用 括号 改变 这 种 
惯常 的 顺序 。 


1.3.1 正则 表达 式 的 形式 化 定义 


CRD 称 R 是 一 个 正则 表达 式 ， 如 果 尺 是 
l. a， 这 里 a 是 字母 表 中 的 一 个 元 素 ; 
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Wh 
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€; 

Ø ; 

. RUR), ZR, 和 Rs 是 正则 表达 式 ; 
(R11。R;)， 这 里 RI 和 Rs 是 正则 表达 式 ; 
. (R), LZR, 是 正则 表达 式 。 

在 第 1 条 和 第 2 条 中 ， 正 则 表达 式 a foe 分 别 表示 语言 (a) 和 {(s})。 在 第 3 条 中 ， 正 
则 表达 式 刀 表示 空 语 言 。 在 第 4、5、6 条 中 ， 正 则 表达 式 分 别 表示 语言 Ri 和 R: 做 并 运算 
或 连接 运算 或 者 R 做 星 号 运算 得 到 的 语言 。 

不 要 混 消 正 则 表达 式 s 各。 表达 式 e: 表示 只 包含 一 个 字符 串 
表示 不 包含 任何 字符 串 的 语言 。 

表面 上 看 这 里 有 用 其 自身 定义 正则 表达 式 的 危险 。 要 是 果真 如 此 ， 那 么 这 是 一 个 循环 
定义 (circular defination)， 它 将 是 无 效 的 。 但 是 ，R1 MR. 总 是 比 R 小 ， 因 此 ， 实 际 上 
是 在 用 较 小 的 正则 表达 式 定 义 较 大 的 正则 表达 式 ， 从 而 避免 了 循环 。 这 种 类 型 的 定义 称 为 
归纳 定义 Cinductive defination) 。 

表达 式 中 的 括号 可 以 略 去 。 如 果 略 去 括号 ， 计 算 按 照 下 述 优 先 顺 序 进 行 : 星 号 ， 连 
接 ， 然 后 并 。 

为 便于 描述 将 RR* WER. MMR, BR* 表示 由 0 个 或 多 个 R 中 的 串 连 接 构 
RAPA, Ro 表示 由 1 个 或 多 个 R 中 的 串 连接 构成 的 所 有 串 。 因 此 R* Ue 一 R*。 此 
Sh, RER DR 中 的 串通 过 连接 得 到 的 串 简 记 作 R*。 

当 想 要 明显 地 区 分 正则 表达 式 R 和 它 所 描述 的 语言 时 ， 把 R 描述 的 语言 写成 L(R)。 

在 下 面 的 例子 中 假设 字母 表 卫 是 (0,1). 

l. 0*10° 一 (0| 色 从 好 有 有 == 个 14。 

2 1 

3. 5* 001S* ={wlw FATEH 001}. 

4.1* (01T)* ={wlw 中 的 每 一 个 0 后 面 至 少 中 有 一 个 地。 

5. (253)* 二 {wlw 是 长 度 为 偶数 的 字符 串 }9 。 
6 
7 
8 
9 


oS oF = Go BY 





Z RER., MØ 


. (SEE) * 二 {wl|w 的 长 度 为 3 的 整数 倍 } 。 

. 01U10={01,10}. 

. 05* 0U15* 1U0U1={wlw 以 相同 的 符号 开始 和 结束 }。 

» (Ue)1* =01* UI; 

RAA 0Ue 表示 语言 (0,e}， 因 此 连接 运算 把 0 或 e 加 在 1* 中 每 一 个 字符 串 的 前 面 。 
10. (OUe) (1Ue) = {e,0,1,01}. 


ll. 1* =Ø., 

把 空 集 连 接 到 任何 集合 上 得 到 空 集 。 

12. Ø* —te). 

星 号 运算 把 该 语言 中 的 任意 个 字符 串 连 接 在 一 起 ， 得 到 运算 结果 中 的 一 个 字符 串 。 如 
果 该 语言 是 空 集 ， 星 号 运算 能 把 0 个 字符 串 连接 在 一 起 ， 得 到 唯一 的 空 串 。 i 


O 字符 串 的 长 度 是 指 它 含 有 的 符号 的 个 数 。 
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若 设 R 是 任意 的 正则 表达 式 ， 可 以 得 到 下 述 恒等式 。 它 们 能 很 好 地 检查 读者 是 否 理解 
了 正则 表达 式 的 定义 。 


RUS=R 
把 空 语 言 加 到 任 一 其 他 语言 上 不 会 改变 这 个 语言 。 
Ree=R 


把 空 串 加 到 任 一 字符 串 上 不 会 改变 这 个 字符 串 。 

但 是 ， 交 换 前 面 两 个 恒等式 中 的 和 可 能 导致 恒等式 不 成 立 。 

RUe 可 能 不 等 于 尺 。 

例如 ， 如 果 R=0, AKA LCR)={0}, 而 LC(RUe)= {0,e)。 

Re OW REARS F R. 

例如 ， 如 果 R=0, AA LCR)={0}, MLIR°O)=o, | 

在 设计 程序 设计 语言 的 编译 程序 中 ， 正 则 表达 式 是 个 很 有 用 的 工具 。 程 序 设计 语言 
的 基本 对 象 称 为 单字 (token)， 如 变量 名 和 和 常量， 它们 可 以 用 正则 表达 式 描 述 。 例 如 ， 可 
能 包括 小 数 部 分 和 (或 ) 正 负 号 的 数值 常量 可 以 描述 成 下 述 语 言 的 一 个 成 员 

at LD Bt UD Bt) 

其 中 D=={0,1,2,3,4,5,6,7,8,9) 是 十 进 制 数字 字母 表 。 几 个 生成 的 字符 串 例 子 如 : 72, 
3. 14159 ,十 7. 和 一 . 01. 

一 旦 程序 设计 语言 中 单字 的 语法 用 正则 表达 式 描 述 出 来 ， 自 动 系统 便 能 够 生成 词法 分 
析 器 (lexical analyzer)， 它 是 编译 程序 的 一 部 分 ， 用 来 在 开始 阶段 处 理 输入 程序 。 


1.3.2 与 有 穷 自动 机 的 等 价 性 


就 描述 能 力 而 言 正则 表达 式 和 有 穷 自动 机 是 等 价 的 。 这 个 事实 是 相当 出 乎 意料 的 ， 因 为 
表面 上 看 有 穷 自 动机 和 正则 表达 式 是 很 不 相同 的 。 然 而 ， 任 何 正 则 表达 式 都 能 够 转换 成 能 识 
别 它 所 描述 语言 的 有 穷 自 动机 ， 反 之 亦 然 。 回 忆 一 下 正则 语言 是 有 穷 自 动机 识别 的 语言 。 

一 个 语言 是 正则 的 ， 当 且 仅 当 可 以 用 正则 表达 式 描述 它 。 

这 个 定理 有 两 个 方向 。 把 每 个 方向 叙述 成 一 条 单独 的 引 理 并 加 以 证 明 。 

GERM) 如 采 一 个 语言 可 以 用 正则 表达 式 描 述 ， 那 么 它 是 正则 的 。 

证 明 思 路 ”假设 正则 表达 式 R 描述 某 语 言 A 。 要 说 明 怎 样 把 R 转换 成 一 台 识 别 A 的 
NFA。 根 据 推论 1. 20， 如 果 一 台 NFA 识别 A， 则 A 是 正则 的 。 

证 明 把 R 转换 成 一 台 NFA N。 考 虑 正则 表达 式 定义 中 的 6 种 情况 。 

1l. R= 二 a， 这 里 a€E€3。 那 么 ，L(R)= 二 {a}， 下 述 NFA 识别 LOR): 


OO OO 
注意 到 这 台 机 器 符合 NFA 的 定义 ， 但 不 符合 DFA 的 定义 ， 因 为 它 的 状态 不 是 对 每 一 
个 可 能 的 输入 符号 都 有 射出 的 箭头 。 当 然 这 里 也 能 够 给 出 等 价 的 DFA， 但 是 ， 现 在 有 
NFA 就 可 以 了 ， 而 且 它 更 容易 描述 一 些 。 
形式 地 表示 ，N=((ai ,q,},Z,6,gq ,19,})， 其 中 6 的 定义 如 下 : 若 r 关 qj X bAa, N 
lgj sa) =i g} 07, =O. 
2. R=e, ABA LCR) =e}. F NFA 识别 LCR): 


形式 地 表示 ， N= (iq, } 92 905q1 {th })> 其 中 对 所 有 的 > Alb, lr, b) =Ø. 
3. R=Ø, HWA LIR) =Ø. F NFA 识别 L(R): 


Kha, N=({q}:-5.801:- 0), ERWA r Mb, lr, b) =Ø. 

4. R=R, UR: 

5. R=R, ° R? 

6. R=R, * 

对 后 3 种 情况 ， 使 用 正则 语言 类 在 正则 运算 下 封闭 的 证 明 中 所 给 出 的 构造 。 换 句 话 
说 ， 由 识别 Ri 和 R。( 在 情况 6 PAAR) 的 NFA 构造 出 关于 R 的 NFA， 从 而 得 到 需 
要 的 NFA, | 

这 就 结束 了 定理 1. 28 证 明 的 第 一 部 分 ， 给 出 当 且 仅 当 中 较 容 易 的 方向 。 在 接着 证 明 
另 一 个 方向 之 前 ， 先 看 几 个 例子 ， 用 上 述 过 程 把 正则 表达 式 转换 成 NFA。 

分 若干 阶段 把 正则 表达 式 (abU a)* 转换 成 一 台 NFA。 从 最 小 的 子 表达 式 
到 大 一 点 的 子 表达 式 逐 步 建立 ， 直 至 获得 关于 原始 表达 式 的 NFA， 如 图 1- 27 所 示 。 注 意 
这 个 过 程 一 般 不 能 给 出 状态 最 少 的 NFA。 本 例 给 出 一 台 有 8 个 状态 的 NFA， 而 等 价 的 最 
小 NFA 只 有 2 个 状态 。 你 能 找 出 这 人 台 最 小 的 NFA 吗 ? 


a 
b 一 (> 人 
ab OOOO 


abUa 


(ab U a)* 





图 1-27 根据 正则 表达 式 (abUa) ”构造 一 台 NFA a 


在 图 1-28 中 ， 正 则 表达 式 (aUb) x aba 被 转换 成 一 台 NFA。 有 几 小 步 没 
有 在 图 中 给 出 。 a 
现在 回 到 证 明定 理 1. 28 的 另 一 个 方向 。 


Heyes 如 果 一 个 语言 是 正则 的 ， 则 可 以 用 正则 表达 式 描 述 它 。 
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(aUb)* +O) 


ETA >O Ir E >C) DSO E >() a > 人 


(aUb)*aba 





1-28 根据 正则 表达 式 (aUb) x aba 构造 一 台 NFA 


证 明 思 路 ”需要 证 明 : 如 果 语 言 A 是 正则 的 ， 则 有 一 个 正则 表达 式 描 述 它 。 由 于 A 
是 正则 的 ， 故 它 被 一 台 DFA RS. 下面 给 出 一 个 把 DFA 转换 成 等 价 的 正则 表达 式 的 


过 程 。 


这 个 过 程 分 两 部 分 ， 这 里 要 使 用 一 种 称 为 广义 非 确 定型 有 穷 自动 机 的 新 型 有 穷 自 动 
机 ， 简 记 作 GNFA。 首 先 说 明 如 何 把 DFA 转换 成 GNFA， 然 后 说 明 如 何 把 GNFA 转换 成 


正则 表达 式 。 


广义 非 确定 型 有 穷 目 动机 就 是 非 确定 型 有 穷 自 动机 ， 只 是 转移 箭头 可 以 用 任何 正则 表 


达 式 作 标 号 ， 而 不 是 只 能 用 字母 表 的 成 员 或 es 
作 标 号 。GNFA 读 输 入 符号 段 ， 而 不 必 像 普 
通 NFA 一 次 只 能 读 一 个 符号 。GNFA 读 一 段 
输入 符号 ， 沿 着 连接 两 个 状态 的 箭头 移动 ， 
这 段 输入 符号 正好 是 那个 箭头 上 的 正则 表达 
式 描 述 的 一 个 字符 串 。GNFA 是 非 确 定性 的 ， 
从 而 可 能 有 好 几 种 不 同 的 方式 处 理 同一 个 输 
入 串 。 如 果 它 的 处 理 能 够 使 得 GNFA 在 输入 
结束 时 进入 一 个 接受 状态 ， 则 它 接受 它 的 输 
入 。 图 1- 29 给 出 了 一 个 GNFA 的 例子 。 

为 方便 起 见 ， 要 求 GNFA 具有 符合 下 述 
条 件 的 特殊 形式 : 





图 1- 29 一 台 广 义 非 确定 型 有 穷 自 动机 


。 起 始 状态 有 射 到 其 他 每 一 个 状态 的 箭头 ， 但 是 没有 从 任何 其 他 状态 射 人 的 箭头 。 
。 有 唯一 的 一 个 接受 状态 ， 并 且 它 有 从 其 他 每 一 个 状态 射 人 的 箭头 ， 但 是 没有 射 到 
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任何 其 他 状态 的 箭头 。 此 外 ， 这 个 接受 状态 与 起 始 状态 不 同 。 

。 除 起 始 状态 和 接受 状态 外 ， 每 一 个 状态 到 自身 和 其 他 每 一 个 状态 都 有 一 个 箭头 。 

能 够 很 容易 地 把 DFA 转换 成 这 种 特殊 形式 的 GNFA。 添 加 一 个 新 的 起 始 状态 和 一 个 
新 的 接受 状态 ， 从 新 起 始 状态 到 原 起 始 状态 有 一 个 es 箭头 ， 从 每 一 个 原 接 受 状 态 到 新 接受 
状态 有 一 个 ss 箭头。 如 果 一 个 箭头 有 多 个 标记 (或 者 在 两 个 状态 之 间 有 多 个 方向 相同 的 箭 
头 )， 则 把 它 替 换 成 一 个 标记 着 原先 标记 的 并 集 的 箭头 。 最 后 ， 在 没有 箭头 的 状态 之 间 添 
加 标记 包 的 箭头 。 最 后 一 步 不 会 改变 识别 的 语言 ， 因 为 标记 儿 的 转移 永远 不 能 被 使 用 。 从 
现在 起 ， 假 设 所 有 的 GNFA 都 是 这 种 特殊 形式 的 。 

下 面 说 明 如 何 把 GNFA 转换 成 正则 表达 式 。 设 这 人 台 GNFA A k SRA. HF GNFA 
必须 有 一 个 起 始 状态 和 一 个 接受 状态 ， 并 且 这 两 个 状态 是 不 相同 的 ， 因 此 & 之 2。 如 果 RO 
2， 则 构造 一 台 有 一 1 个 状态 的 等 价 GNFA。 对 新 的 GNFA 重复 这 一 步骤 直至 把 它 化 简 
BAA 2ZhRA. 4 k=2 f, XA GNFA 只 有 一 
个 从 起 始 状态 到 接受 状态 的 箭头 。 这 个 箭头 的 标记 
就 是 等 价 的 正则 表达 式 。 例 如 ， 图 1- 30 中 给 出 了 
把 一 台 有 3 个 状态 的 DFA 转换 成 等 价 的 正则 表达 
式 的 各 个 阶段 。 

关键 的 步骤 是 当 & 之 2 时 构造 等 价 的 少 一 个 状 
态 的 GNFA。 为 此 ， 挑 选 一 个 状态 ， 把 它 从 机 右上 图 1-30 ”把 DFA 转换 成 正则 
删 掉 ， 并 且 修 改 留 下 来 的 部 分 使 其 仍然 识别 相同 的 表达 式 的 典型 阶段 
语言 。 可 以 挑选 任意 一 个 状态 ， 只 要 它 不 是 起 始 状态 或 接受 状态 ， 当 & 之 2 时 ， 一 定 存 在 
这 样 的 一 个 状态 。 把 这 个 被 删 去 的 状态 称 为 qi。 

WA cs 后 ， 要 修改 每 一 个 留 下 来 的 箭头 上 标记 的 正则 表达 式 。 新 标记 中 加 进 了 失去 
的 计算 ， 从 而 弥补 了 由 于 删 去 gq, 带 来 的 损失 。 从 状态 q; 到 状态 g; 的 新 标记 是 描述 使 机 顺 
从 gq; 直接 到 g, 或 者 通过 gs 到 gq; 的 所 有 字符 串 的 正则 表达 式 。 图 1- 31 说 明了 这 个 方法 。 


R, 
R, z R 
ft 


原 图 修改 后 
图 1-31 构造 等 价 的 少 一 个 状态 的 GNFA 





(Ri) (R2)* (R3) U (R4) 





R, 


在 原 机 器 中 ， 如 果 
1. 从 q; 到 g。， 有 一 个 标记 为 Ri 的 箭头 ， 
2. 从 gi 到 它 自己 有 一 个 标记 为 Rs 的 箭头 ， 
3. 从 qj, 到 gq, 有 一 个 标记 为 Rs 的 箭头 ， 
4. 从 q; Bla, 有 一 个 标记 为 R 的 箭头 ， 
那么 在 新 机 器 中 ， 从 gq; 到 gq; 的 箭头 的 标记 为 
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(Ri1)(R;) * (R;3)U (Rs) 

对 从 任 一 状态 q; 到 任 一 状态 gq; (包括 q 5a 在 内 ) 的 每 一 个 箭头 进行 这 样 的 改动 。 
新 的 机 融 仍 然 识 别 原 来 的 语言 。 

证 明 现在 来 形式 地 实现 上 述 想 法 。 为 便于 证 明 ， 首 先 形式 地 定义 引入 的 新 型 自动 
机 。 除 转移 函数 外 ，GNFA 与 非 确 定型 有 穷 自动 机 类 似 。GNFA 的 转移 函数 的 形式 为 

Riadi IAO amn OR 

符号 有 R 是 字母 表 王 上 的 全 体 正 则 表达 式 组 成 的 集合 ，qgsanr 和 qo 分 别 是 起 始 状 态 和 接受 
TRA. MAH e SR, WARS q; 到 状态 gq; 的 箭头 以 正则 表达 式 尺 作为 它 的 标记 。 转 
移 函 数 的 定义 域 为 (Q 一 {qs})X(Q 一 (gsrn})， 这 是 因为 除了 gs 没有 射出 的 箭头 和 
qi 没有 射 人 的 箭头 ， 每 一 状态 到 另 一 状态 都 有 一 个 箭头 连接 。 

广义 非 确定 型 有 穷 自 动机 (Q,5,6,q, laen) 是 一 个 5 元 组 ， 其 中 : 

1. Q 是 有 穷 的 状态 集 。 

2. 互 是 输入 字母 表 。 

3. 8: CQ (lacet?) X (QT {tare IPR 是 转移 函数 。 

4. don EERS. 

5. gsccept 是 接受 状态 。 

如 果 字 符 串 w 可 写成 w= 二 wi wz… we， 这 里 每 一 个 w; E33* ， 并 且 存 在 状态 序列 q。， 
QoQ» (TF: 

le Gy =Qstart ENEMA KA o 

2. qi 一 qsccent 是 接受 状态 。 

3. 对 每 一 个 i，w;EL(R;)， 其 中 R;= 二 6(g,_ ,9g;)， 即 R: 是 从 g,_, 到 g, 的 箭头 上 的 
表达 式 。 
则 称 这 台 GNFA 接受 字符 串 w. 

现在 回 到 引 理 1. 32 的 证 明 。 设 DFA M 识别 语言 A。 通 过 添加 一 个 新 的 起 始 状态 、 一 个 
新 的 接受 状态 以 及 一 些 必要 的 转移 箭头 ， 把 M 转换 成 一 台 GNFA G。 过 程 CONVERT(G) 
取 一 台 GNFA 作为 输入 ， 返 回 一 个 等 价 的 正则 表达 式 。 该 过 程 采 用 递归 方式 ， 即 它 要 调 
用 它 自 己 。 由 于 该 过 程 只 是 在 要 处 理 少 一 个 状态 的 GNFA 时 才 调 用 它 自 己 ， 故 不 会 出 现 
无 穷 循 环 。 当 GNEFA 只 有 两 个 状态 时 ， 就 用 非 递归 的 方式 进行 处 理 。 

CONVERT(C) : 

1 KREG 的 状态 数 。 

2. WWR k=2, M) G 一 定 是 由 一 个 起 始 状 态 、 一 个 接受 状态 和 连接 这 两 个 状态 的 箭头 
组 成 ， 设 箭头 上 的 标记 为 正则 表达 式 玉 。 

返回 这 个 表达 式 R。 

3. 如 果 & 二 2， 则 任 取 一 个 状态 9, EQ {lotat lace? > ES C 为 GNFA(Q ,3,6， 
Onit Baan) e REP 

Q =Q lda) 
并 且 对 每 一 个 gEQ- Maen? 和 每 一 个 ER -ta F 
ò (gq;»q;) =(R1) (R2) * (R3) U (R4) 

其 中 Ri =8(q; raip) > Re =58Cip trip) » Rs =li; ) 及 Ri=6(g;,q;). 


的 2- 状 态 DFA 开始 


ZI EM 
计算 CONVERT(G’) 且 返 回 这 个 值 
下 面 证 明 CONVERT(G) 返回 的 值 是 正确 的 


= 
(= 


45 
对 任意 的 GNFA G, CONVERT(G) 等 价 于 G 

对 G 的 状态 数 & 作 归 纳 证 明 。 

归纳 基础 : 


符 串 。 因 而 这 个 表达 式 等 价 于 G 
归纳 3 


为 真 。 首 先 ， 证 明 G AG 识别 相同 的 语言 


证 明 对 于 & 一 2， 断 言 为 真 。 知 G 只 有 2 个 状态 ， 它 只 可 能 有 1 个 箭头 ， 从 
分 支 中 ，G 依次 进入 下 列 状 态 


起 始 状 态 到 接受 状态 。 这 个 箭头 上 标记 的 正则 表达 式 描 述 了 能 使 C 到 达 接 受 状态 的 全 部 字 
的 每 一 


计算 


。 设 状态 


归纳 步骤 : 假设 断言 对 于 & 一 1 个 状态 为 真 ， 利 用 这 个 假设 ,证 明 对 于 个 状态 断言 
dstart 941 ?42 yd3， 


假设 G 接受 输入 w， 那 么 在 计算 的 一 个 接受 
** 9 daccept 
如 果 被 删 去 的 状态 qu 不 在 这 些 状态 中 ， 则 显然 G 也 接受 w。 这 是 因为 标记 G 的 箭头 
个 新 正则 表达 式 包 含 原 有 正则 表达 式 作 为 并 集 的 一 部 分 。 
如 果 g,;, 出 现在 这 些 状态 中 ， 则 删 去 这 个 状态 序列 中 所 有 的 qu， 得 到 G 的 一 个 接受 
q; Ma, 之 间 夹 着 奉 干 个 连续 的 gu， 则 它们 之 间 的 箭头 上 的 新 正则 表达 式 描 
REG 中 使 gq, 经 过 gq,, 到 gq; 的 所 有 字符 串 。 因 此 G 接 
另 一 方面 ， 假 设 G 接受 输入 w。 由 于 G 中 任意 两 个 状态 g, Me, 之 间 箭 头 上 的 正则 表 
达 式 描述 在 G Pq, 直接 或 经 过 9g,,, 到 达 g,; 的 所 有 字符 串 组 成 的 集合 ， 故 G 也 一 定 接受 
ü. FH, GAG 等 价 
| 5s = > 


归纳 假设 表明 ， 当 算法 对 输入 G 递归 地 调用 它 自己 时 ， 由 于 G 有 & 一 1 个 状 
得 到 一 个 等 价 于 G 的 正则 表达 式 ， 从 而 这 个 正则 表达 式 也 等 价 于 G, 
例 1. 


和 有 
| ijl 
这 就 完成 了 断言 1. 34、 引 理 1. 32 和 定理 1. 28 的 证 明 


SARA» 
得 i 
在 本 例 中 ， 运 用 上 面 的 算法 把 DFA 转换 成 正则 表达 式 。 从 图 1- 32(a) 中 
表 2 个 转移 


因此 
证 算法 是 正确 的 
il 
在 图 1-32(b) 中 ， 通 过 添加 一 个 新 的 起 始 状 态 和 一 个 新 的 接受 状 
环 上 标记 a 


a. ’ 得 到 一 侣 4 状 
态 的 GNFA。 把 qt 和 gccow 分 别称 为 s 和 a， 这 样 画 起 来 方便 些 。 为 避免 把 图 搞 得 乱 七 八 
B 
[=e 


: aes 
田 
糟 ， 没 有 画 出 标记 为 儿 的 箭头 ， 尽 管 图 中 确实 有 这 样 的 第 头 。 注 意 ， 在 DFA 中 状态 2 的 
W Ath 
DA 
在 图 1- 32(c) 中 


A , 
个 对 应 a， 另 一 个 对 应 b， 而 GNEFA 只 能 有 一 个 从 2 到 它 自 身 的 转移 
， IZ YB 
已 是 从 1 到 a 的 标记 。 在 图 b PERO, MEA ( 中 是 b (aUb)*。 
VERT 的 步骤 3 得 到 如 下 结果 : 状 
aUb, R; =e kK R= 


b, Æ GNFA 中 对 应 处 被 替换 成 标记 aUb。 这 样 做 是 因为 DFA 中 的 标记 代 
, 
删 去 状态 2， 修 改 留 下 的 箭头 上 的 标记 。 这 次 只 有 一 个 标记 要 改变 ， 


根据 过 程 CON- 
q; 是 状态 1 状态 di JE Gs 而 gis 是 2， 故 Ri =b, R, = 
D. KA, MA 1 到 4a 的 箭头 上 的 新 标记 是 (b) (aUb) * (e) U8g。 这 个 
正则 表达 式 可 人 简化 成 bl(aUb)*。 
war 


在 图 1-32(d) +, WER (c) 中 的 状态 1， 并 且 按照 同样 的 步骤 进行 。 h FRH 
下 起 始 状 态 和 接受 状态 ， 因 此 连接 它们 的 箭头 上 的 标记 就 是 等 价 于 原 DFA 的 正则 表 
a 33 iA. 


本 例 从 一 台 3- 状 态 的 DFA 开始 ， 转 换 成 等 价 的 正则 表达 式 的 步骤 如 


a*b(a U b)* 


(d) 








(ba Ua) (aa U b)*ab U bb 





(d) 


(a(aa U b)*ab U b)((ba U a)(aa U b)*ab U bb)*((ba U a)(aa U b)* Ue) U a(aa U b)* 
(e) 


Al 1-33 把 一 台 3- 状 态 的 DFA 转换 成 等 价 的 正则 表达 式 


14 非 正 则 语言 


要 了 解 有 穷 目 动机 的 能 力 ， 必 须 同 时 了 解 它 们 的 局 限 性 。 这 一 节 将 讲述 如 何 证 明 某 些 
语言 不 可 能 用 有 穷 自动 机 识别 。 

设 语言 B=({0"l"|n>0}, WRBR—-BRG B 的 DFA, 会 发 现 这 台 机 器 看 起 来 需要 
记 住 至 此 它 在 输入 中 读 到 了 多 少 个 0。 由 于 0 的 个 数 没有 限制 ， 因 此 机 器 将 不 得 不 记 住 无 
穷 多 个 可 能 。 但 是 ， 用 有 穷 个 状态 不 可 能 做 到 这 一 点 。 

下 面 给 出 一 种 方法 ， 用 来 证 明 像 B 这 样 的 语言 不 是 正则 的 。 由 于 0 的 个 数 没有 限制 ， 
上 面 给 出 的 论证 不 是 已 经 证 明了 B 的 非 正则 性 了 吗 ? 非 也 。 这 些 看 起 来 需要 无 穷 存储 的 语 
言 并 不 意味 着 一 定 需 要 无 穷 的 存储 。 语 言 B 确实 是 非 正 则 的 ， 但 是 另外 一 些 语言 看 起 来 也 
需要 无 穷 多 个 可 能 ， 而 实际 上 却 是 正则 的 。 例 如 ， 考 虑 字母 表 5={0,1) 上 的 两 个 语言 : 
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C={wlw 中 0 和 1 的 个 数 相 等 }， 

D={w|w 中 01 和 10 作为 子 串 出 现 的 次 数 相 同 } 

初 看 一 下 ， 识 别 这 两 个 语言 的 机 器 都 需要 计数 ， 因 而 好 像 都 不 是 正则 的 。 正 如 所 预料 
的 那样 C 不 是 正则 的 ， 但 令 人 吃惊 的 是 ， 是 正则 的 2 ! 可 见 直 觉 有 时 可 能 会 把 我 们 带 人 
卜 途 。 这 就 是 为 什么 想当然 的 事情 还 需要 数学 证 明 。 本 节 将 说 明 如 何 证 明 某 些 语言 不 是 正 
则 的 。 


关于 正则 语言 的 泵 引 理 


证 明 非 正则 性 的 技术 源 于 一 个 关于 正则 语言 的 定理 ， 通 常 把 它 称 为 泵 引 理 (pumping 
lemma) 。 该 定理 指出 所 有 的 正则 语言 都 有 一 种 特殊 的 性 质 。 如 果 能 够 证 明 一 个 语言 没有 
这 种 性 质 ， 则 可 以 保证 它 不 是 正则 的 。 这 条 性 质 是 : 语言 中 的 所 有 字符 串 只 要 它 的 长 度 不 小 
于 某 个 特定 的 值 一 一 泵 长 度 (pumping length)， 就 可 以 被 “抽取 ”。 它 的 意思 是 指 每 一 个 这 
样 的 字符 串 都 包括 一 段子 串 ， 把 这 段子 串 重 复 任意 次 ， 得 到 的 字符 串 仍 在 这 个 语言 中 。 

Rae T RIE) ” 若 A 是 一 个 正则 语言 ， 则 存在 一 个 数 p (RKB) 使 得 ， 如 果 8 
是 A 中 任 一 长 度 不 小 于 p 的 字符 串 ， 那 么 s 可 以 被 分 成 3 段 ，s 一 Tyz， 满 足下 述 条 件 : 

1. 对 每 一 个 10, xryizEA 

2. |y|>0 

3. lzy | SE 

回忆 一 下 这 里 用 的 记号 ，| s | 表示 字符 串 s HKE, y 是 i 个 y 连接 在 一 起 ，y? 等 
T Gg 

X s 被 划分 成 xyz 时 ，z 和 zz 可 以 是 es， 但 是 条 件 2 说 > 天 se。 可 以 看 到 如 果 没 有 条 件 
2， 定 理 显然 成 立 ， 但 也 就 没有 什么 意思 了 。 条 件 3 说 x 和 yy 两 段 在 一 起 的 长 度 不 超过 之 。 
这 是 一 个 额外 的 技术 条 件 ， 偶 尔 会 发 现 它 在 证 明 语 言 的 非 正则 性 时 是 有 用 的 。 关 于 条 件 3 
的 应 用 见 例 1. 39。 

证 明 思 路 设 M=(Q,3,6,g1，,F) 是 识别 A 的 DFA. 令 泵 长 度 p 等 于 MM 的 状态 数 。 
要 证 明 A 中 任意 长 度 不 小 于 p 的 字符 串 s 可 以 划分 成 3 段 zyz， 且 满足 定理 中 的 3 个 条 
件 。 如 果 在 A 中 没有 长 度 不 小 于 p 的 字符 串 怎 么 办 ? 这 时 工作 就 更 容易 了 ， 因 为 定理 显 
RRL: 如 果 没 有 这 样 的 字符 串 ， 则 显然 对 所 有 这 样 的 字符 串 ，3 个 条 件 都 成 立 。 

A s€E A 的 长 度 不 小 于 p， 考 虑 M 对 输入 s 的 计算 中 经 过 的 状态 序列 。 它 从 起 始 状态 
qi 开始， 然后 到 gs; Aaqa ， 再 到 q, ， 等 等 ， 一 直到 s 结束 进入 状态 ql; 。 由 于 属于 A， 
M 接受 y， 因 此 gj, 是 一 个 接受 状态 。 

若 :的 长 度 为 xn， 则 状态 序列 gj ,gj ,qo。，qo，"…，q1s 的 长 度 为 n 十 1。 由 于 不 小 于 
力 ， 故 ?十 1 大 于 M 的 状态 数 p。 因 此 ， 在 这 个 序列 中 一 定 有 重复 出 现 的 状态 ， 这 个 结 
W E #8 SFE (pigeonhole principle) 的 一 个 例子 。 这 个 奇特 的 名 字源 于 下 述 很 明显 的 
事实 : 如 果 要 把 旅 只 够 子 放 进 鲍 梨 ， 而 够 梨 数 小 于 娟 ， 则 一 定 有 些 够 巢 里 将 不 止 有 1 
Amt. 

图 1-34 给 出 字符 串 * 和 M 在 处 理 s 时 经 过 的 状态 序列 。 状 态 gq, 重 复出 现 。 
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Al 1-34 HHK Migs 时 状态 gs 重复 的 例子 


现在 把 * 划分 成 三 段 ，> 和 >z。Z 是 * 在 as 前 面 的 部 分 ，y 是 两 个 gq, 之 间 的 部 分 ，z 
Æ s 的 剩余 部 分 ， 即 第 二 个 gy 以 后 的 部 分 。 因 此 ,， x 4EM 
从 状态 qi HB q,, y 把 M Kat AF q,, zM 从 g, 带 
到 接受 状态 qo WK 1- 35 Pra. 

现在 来 看 看 为 什么 这 样 划 分 s 能 满足 规定 的 3 个 条 
件 。 假 设 对 输入 zyyz 运行 M。 已 知 z 把 M 从 ai HE gq,» 
然后 第 一 个 y 把 它 从 gq, 带 回 到 gq,。， 第 二 个 y 也 同样 把 它 
从 as WER) q, RE z 把 它 带 到 gj; 。 由 于 gq 是 一 个 接 
受 状 态 ， 故 M 接受 输入 zyyz。 类 似 地 ， 对 于 任意 i 二 0， 图 1-35 说 明 字符 串 z，y 和 
它 将 接受 yiz, 4 i=0 时 ，zyiz 二 zz， 根 据 类 似 的 理由 i ce eee 
它 也 被 M 接受 。 这 就 证 实 了 条 件 1。 

At y Es 在 状态 ,出 现 的 两 个 不 同 地 点 之 间 的 部 分 ， 故 可 以 看 到 |y| 六 0。 这 就 验证 
了 条 件 2. 

为 了 使 条 件 3 成 立 ， 确 保 q, 是 序列 中 第 一 个 重复 的 状态 。 根 据 鲍 梨 原理 ， 在 序列 的 前 
pp 十 1 个 状态 中 必定 有 重复 。 因 此 ，|xzy| 过 pp。 

证 明 it M=(Q,5,0.¢,,F) 是 一 台 识 别 A K DFA, p 是 M 的 状态 数 。 

设 s 二 5152… sn 是 A 中 长 度 为 n 的 字符 串 ， 这 里 np., Rr sortie M EWM s 
的 过 程 中 进入 的 状态 序列 ， 因 而 ri+1 二 6(ri si), 1 二 i 之 n。 该 序列 的 长 度 为 n 十 1， 不 小 于 
p 十 1。 根 据 饮 巢 原理 ， 在 该 序列 的 前 p 十 1 SCR, 一定 有 两 个 相同 的 状态 。 设 第 1 个 
是 r;， 第 2 个 是 ri:。 由 于 出 现在 序列 的 前 p 十 1 个 位 置 中 ， 而 且 序 列 是 从 ri 开始 的 ， 故 
有 l<pt+l., WN, $ r=s te 8j-19Y 二 58j*** 9-1 WR z=s1°"* Sno 

由 于 工 把 MM n Her, y 把 M 从 zr; 带 到 x;,z 把 M 从 zr; 带 到 +i， 而 s+i 是 一 个 
接受 状态 ， 故 对 于 ;之 0，M 接受 ryz. BA JAL Mlyl|>0; REMlptl, Klaeyl<p. 
于 是 ， 满 足 泵 引 理 的 3 个 条 件 。 s 

AS iB FARR 5| PRUE MAS B 不 是 正则 的 ， 首 先 假 设 B 是 正则 的 ， 以 便 得 出 矛盾 。 
RERI, FERKE p 使 得 B 中 所 有 长 度 为 p RAF p 的 字符 串 都 可 以 被 抽取 。 其 
KR, 在 B 中 寻找 一 个 字符 串 ;3， 它 的 长 度 为 p 或 大 于 p、 但 不 能 被 抽取 。 最 后 ， 证 明 * 不 
能 被 抽取 。 这 要 考虑 把 s 划分 成 x-、y 和 >z 的 所 有 方式 (如 果 方 便 的 话 ， 把 泵 引 理 中 的 条 
件 3 考虑 进来 )， 并 且 对 每 一 个 这 样 的 划分 ， 找 到 一 个 i 值 使 得 zyiz FB。 在 做 这 最 后 一 步 
时 ， 和 常常 把 划分 s 的 各 种 方式 分 成 若干 种 情况 ， 并 且 分 别 分 析 每 一 种 情况 。 如 果 B 是 正则 
的 ， 存 在 这 样 的 ;与 泵 引 理 了 矛盾。 因此 B 不 可 能 是 正则 的 。 

FR s 有 时 需要 点 创造 性 思维 。 在 找到 合适 的 s 之前， 可 能 需要 在 多 个 候选 中 仔细 搜 
R. AM B 中 那些 看 起 来 反映 了 B 的 非 正 则 性 “本 质 ” 的 成 员 。 后 面 的 一 些 例子 将 更 深 
入 地 讨论 寻找 s 的 方法 。 

meee WR HAA {(0"71"|n>0},. ARS iW B 不 是 正则 的 。 采 用 反 证 法 
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假设 相反 ， 即 B 是 正则 的 。 令 p 是 由 泵 引 理 给 出 的 泵 长 度 。 选 择 s HEAR OPI, 
因为 ;是 B 的 一 个 成 员 且 s 的 长 度 大 于 p， 所 以 人 录 引 理 保证 s 可 以 分 成 3 段 ;二 xyz， 使 得 
对 于 任意 的 i>0, $ ryz 在 B 中 。 下 面 考虑 3 种 情况 ， 说明 这 个 结论 是 不 可 能 的 。 
Rh. RRS MAE 1. FA. 


1. 字符 串 y 只 包含 0。 在 这 种 情况 下 ， 字 符 串 zyyz 中 的 0 比 1 多 ， 从 而 不 是 B 的 成 
2. 字符 串 y 只 包含 1， 这 种 情况 同样 给 出 矛盾 。 


3. FAB y 既 包含 0 也 包含 1。 在 这 种 情况 下 ， 字 符 串 zyyz 中 0 和 1 的 个 数 可 能 相 
等 ， 但 是 它们 的 顺序 乱 了 ， 在 0 的 前 面 出 现 1。 因 此 ，xzyyz 不 是 B 的 成 员 ， 了 矛盾 。 
以 通过 应 用 泵 引 理 的 条 件 3 来 排除 第 2 种 和 第 3 种 情况 ， 进 而 简化 该 证 明 。 
用 反 证 法 。 


这 样 ， 如 果 假 设 B 是 正则 的 ， 则 矛盾 是 不 可 避免 的 。 因 此 ，B 不 是 正则 的 。 注 意 ， 可 
例 1. 39 


在 这 个 例子 中 ， 很 容易 找到 字符 串 s, AA B 中 任何 长 度 为 p 或 大 于 zp 的 字符 串 都 符 
合 要 求 。 在 下 面 两 个 例子 中 ，; 的 某 些 选 择 是 行 不 通 的 ， 所 以 需要 额外 小 心 。 


设 C= 二 {wlw 中 0 和 1 的 个 数 相 同 };， 用 有 泵 引 理 证 明 C 不 是 正则 的 。 证 明 采 
假设 相反 ， 即 C 是 正则 的 。 令 p 是 由 泵 引 理 给 出 的 泵 长 度 。 和 例 1. 38 一 样 ， 设 * 为 
字符 串 0?1?* 。 由 于 s 是 C 的 一 个 成 员 且 长 度 大 于 p， 有 泵 引 理 保证 s 可 以 分 成 三 段 s==xzyz， 
使 得 对 于 任意 的 ;之 0， 字 符 串 ryz 都 在 C 中 。 我 们 想 证 明 这 个 结果 是 不 可 能 的 。 可 是 稍 
等 一 下 ， 这 个 结果 是 可 能 的 ! WRS rAz: RSS, y 是 字符 串 0212， 则 zyiz 中 0 和 1 
的 个 数 总 是 相等 的 ， 从 而 在 C 中 。 所 以 :好像 是 可 以 被 抽取 的 。 
在 这 里 ， 泵 引 理 中 的 条 件 3 是 有 用 的 。 它 规定 在 抽取 Ht, s 必须 被 划分 使 得 |zy| 委 
旋 。 这 样 就 限制 了 s 的 划分 方式 ， 使 得 能 够 比较 容易 地 证 明 所 选取 的 字符 串 ;二 0?1* 是 不 
抽取 。 这 就 给 出 了 所 希望 的 矛盾 。 


可 能 被 抽取 的 。 如 果 | zy | <p, M y 一 定 只 由 0 组 成 ， 从 而 zyyz 人 多 C。 因 此 不 可 能 被 


符 串 时 没有 成 功 ， 不 要 丧失 信心 。 再 来 一 次 ! 


在 这 个 例子 中 ， 选 取 字 符 串 s 比 在 例 1. 38 中 需要 更 加 小 心 。 如 果 改 为 选择 * 王 (01)2， 
非 正 则 的 。 


(01)*”*。 那 么 对 于 i 的 每 一 个 值 ，xy'z EC。 如 果 在 第 一 次 尝试 寻找 一 个 不 能 被 抽取 的 字 
则 Cf10* 1* 也 是 正则 的 。 理 由 是 语 


一 
一 一 
= 


就 会 遇 到 有 麻烦。 因为 所 需要 的 是 一 个 不 能 被 抽取 的 字符 串 ， 而 这 个 ; 是 能 被 抽取 的 ， 其 至 
把 条 件 3 考虑 在 内 也 能 被 抽取 。 想 一 想 如 何 抽 取 它 ? 一 个 办 法 是 令 c=, y=01 和 z= 


已 知 B 是 非 正则 的 ， 由 此 可 以 得 到 男 一 个 证 明 C 是 非 正 则 的 方法 。 如 果 C 是 正则 的 ， 


0* 1* 是 正则 的 ， 并 且 正 则 语言 类 在 交 运 算 下 封闭 
(在 1.1.5 市 的 脚注 中 证 明了 这 条 性 质 )， 但 是 Cf10* 1* 等 于 B， 并 且 由 例 1.38 可 知 B 是 


GERD 设 Ff= {ww|we {0,1}* )。 用 泵 引 理 说 明 下 不 是 正则 的 。 

假设 相反 ， 即 下 是 正则 的 。 设 p 是 泵 引 理 给 出 的 泵 长 度 ， 设 s 是 字符 串 0?10?1。 因 为 
是 下 的 一 个 成 员 ， 并且 s 的 长 度 大 于 p， 故 泵 引 理 保证 s 能 够 被 划分 成 3 段 ，s 二 zyz， 满 
足 引 理 中 的 3 个 条 件 。 目 标 是 证 明 这 个 结果 是 不 可 能 的 。 


we 
条 件 3 再 一 次 是 不 可 缺少 的 。 如 果 没 有 这 一 条 ， 令 zx 和 >z 为 空 第 ， 就 能 够 抽取 s。 当 
满足 条 件 3 时 ， 证 明 如 下 : 因为 > 一 定 仅 由 0 组 成 ， 故 zxyyz 下 。 
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选择 ;二 0*10?1， 注 意 到 这 是 一 个 能 显示 下 非 正 则 性 “本 质 ” 的 字符 串 。 相 反 地 ， 
例如 字符 串 070? 就 不 能 。 虽 然 0007 是 下 的 一 个 成 员 , 但 是 它 能 被 抽取 ， 所 以 不 能 给 出 
FA. e 

EED x2 eR—TEEMM—IBA. i D=(1" |n>0). M, 包含 所 有 由 
1 组 成 、 长 度 为 完全 平方 的 字符 串 。 用 泵 引 理 证 明 D 不 是 正则 的 。 证 明 采 用 反 证 法 。 

假设 相反 ， 即 D 是 正则 的 。 设 p 是 泵 引 理 给 出 的 泵 长 度 ，s 是 字符 串 1? 。 由 于 是 了 
的 一 个 成 员 且 长 度 不 小 于 p, RIRE s 能 被 划分 成 3 段 ，s 二 zyz， 使 得 对 任意 的 i 宇 0， 
字符 串 zxyiz 在 D 中 。 和 前 面 的 例子 一 样 ， 要 证 明 这 个 结果 不 可 能 的 。 这 里 需要 考虑 一 下 
完全 平方 数 序列 : 

0O,1,4,.9516,25,36,49 3 

注意 序列 中 相 邻 的 两 个 数 之 间 的 间隔 在 增 大 ， 序 列 中 大 的 数 不 可 能 彼此 靠近 。 

现在 考虑 两 个 字符 串 ryz 和 zyzz。 它 们 之 间 相 差 y 的 一 次 重复 ， 因 而 它们 的 长 度 相 
差 y 的 长 度 。 RHR I MAE 3. leyl <p, Mifilyl<p. HFlaeyzl=—p?, AW 
lazy’ z| Kp tp. 但 是 p?tp<p?+2pt+1=(pt 1)’, HR 2 意味 y 不 是 空 串 ， 所 以 
Lry z| >p. AF ryz 的 长 度 严格 地 在 p? 和 (zz 十 1)2 这 两 个 连续 的 完全 平方 数 之 间 。 
因此 该 长 度 肯定 不 是 一 个 完全 平方 数 。 从 而 得 出 结论 zy*z4 DD 并 且 DD 不 是 正则 的 。 时 

TEED ZHAN, Ait “WH” ERAM. MASER E= {01 |i> 
ji 不 是 正则 的 。 采 用 反 证 法 证 明 。 

假设 已 是 正则 的 。 设 问 是 泵 引 理 给 出 的 关于 下 的 泵 长 度 。 令 *=0z+112。 于 是 s 能 够 
被 划分 成 zyz， 且 满足 泵 引 理 的 条 件 。 根 据 条 件 3，y 仅 包含 0。 检查 字 符 串 zxyyz， 看 它 
是 否 在 下 中。 添加 一 个 y 使 0 的 数目 增加 。 而 已 包含 0*1* 中 所 有 0 多 于 1 的 字符 串 ， 因 
而 增加 0 的 数目 给 出 的 字符 串 仍 在 巨 中 ， 没 有 矛盾 。 因 此 需要 试 试 别 的 办 法 。 

泵 引 理 指出 ， 当 ;一 0 时 也 有 xyiz EE， 因 此 考虑 字符 串 xyoz 一 zz。 删 去 串 y 使 0 的 
数目 减少 ， 而 s 中 0 只 比 1 多 一 个 。 因 此 ，xz 中 的 0 不 可 能 比 1 多， 从 而 它 不 可 能 是 瓦 的 
一 个 成 员 。 于 是 得 到 矛盾 。 了 


练习 
A1.1 下 图 给 出 了 两 台 DFA M 和 M 的 状态 图 。 回 答 下 述 关 于 这 两 台 机 器 的 问题 。 





a. 它们 的 起 始 状 态 是 什么 ? b. 它们 的 接受 状态 集 是 什么 ? 
c 对 输入 aabb， 它 们 经 过 的 状态 序列 是 什么 ? d. 它们 接受 字符 串 aabb 吗 ? 
e 它们 接受 字符 串 e 吗 ? 
^1.2 给 出 练习 1. 1 中 画 出 的 机 器 Mi AM, 的 形式 化 描述 。 
1.3 DFA M 的 形式 化 描述 为 ({q] ,q, ,qi ;94,9s } {ud},6,q，,{qs))， 其 中 6 在 下 表 中 给 出 。 试 画 出 这 
台 机 器 的 状态 图 。 


1.4 


1.5 


1. 6 


1.7 


1.8 


1.9 
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下 面 每 个 语言 都 是 两 个 简单 语言 的 交 。 对 每 一 小 题 先 构造 简单 语言 的 DFA， 然 后 按照 1. 1.5 节 的 
脚注 所 讨论 的 构造 方法 结合 它们 以 画 出 给 定语 言 的 DFA 状态 图 。 在 所 有 问题 中 2== {a,b}. 
a. (w|w 含 有 至 少 3 个 a 和 至 少 2 个 b} Ab. (w w 含有 正好 2 个 a 和 至 少 2 个 b} 
c. (w w 含有 偶数 个 a 和 1 个 或 2 个 b) Ad. (w w FABAN a 并 且 每 个 a 后 都 跟 有 至 少 一 个 b} 
e. {w|w 从 a 开始 并 且 最 多 有 1 个 b} f. (ww 含有 奇数 个 a 并 且 以 bb 结束} 
g (w w 的 长 度 为 偶数 并 且 有 奇数 个 a) 
下 述 每 个 语言 都 是 一 个 简单 语言 的 补 。 对 每 一 小 题 先 构造 简单 语言 的 DFA， 然 后 用 其 画 出 给 定语 
言 的 DFA 状态 图 。 在 所 有 问题 中 3= {a,b}. 


^a (wlw 中 不 含 子 串 ab} Ab. {wl|w PAG FH baba} 
c. (w w PRAS HLH ab 也 不 包含 子 串 ba d. (w w EPE a* b* 中 的 任意 串 ) 
e. {w|w 是 不 在 (ab+ )* 中 的 任意 串 } f. (w w 是 不 在 a* Ub* 中 的 任意 串 } 
g. (ww 是 恰好 不 含 2 个 a 的 任意 串 )} h. {w|w 是 除 a 和 bb 外 的 任意 串 ) 


画 出 识别 下 述 语言 的 DFA 状态 图 。 在 所 有 问题 中 字母 表 均 为 {0,1}. 
a.{wlwh 1 开始 且 以 0 结束 ) 

b. {wlw 含 有 至 少 3 个 1} 

(ww RATP 0101( 即 对 某 个 x 和 yy ,w= 二 x0101y)) 

. {w w 的 长 度 不 小 于 3, 并 且 第 3 个 符号 为 0} 

(wlw 从 0 开始 且 长 度 为 奇数 ,或 者 从 1 开始 且 长 度 为 偶数 ) 

f. (wlw RAF H 110} 

g. (w w 的 长 度 不 超过 5) 

h. {wlw 是 除 11 和 111 外 的 任意 串 ) 

i. (w| w 的 奇数 位 置 均 为 1) 

j. {ww| 包 含有 至 少 2 个 0 并且 至 多 含 1 个 1) 

k. {es0} 

lL (让 | 也 含有 偶数 个 0 或 恰好 2 个 1) 

m. 空 集 

n， 除 空 串 外 的 所 有 字符 串 

给 出 识别 下 述 语言 的 NFA， 并 且 符 合 规定 的 状态 数 。 在 所 有 问题 中 字母 表 均 为 (0,1). 


a p 


多 


Aa. 语言 {w | w 以 00 结束 }，3 个 状态 。 b. 练习 1. 6c 中 的 语言 ，5 个 状态 。 
ce 练习 1. 61 中 的 语言 ，6 TRA. d. 语言 {0}，2 个 状态 。 

e 语言 0*1*0+ ，38 个 状态 。 Af. a 1* (001+)* , 3 RA. 
g 语言 {e} ，1 个 状态 。 h. 语言 0* ，1 个 状态 。 
使 用 定理 1. 22 证 明 中 的 构造 ， 给 出 识别 下 述 语言 的 并 集 的 NFA RAB. 

a. 练习 1.6a 和 1.6b 中 的 语言 。 b. 练习 1. 6c 和 1. 6f 中 的 语言 。 
使 用 定理 1. 23 证 明 中 的 构造 ， 给 出 识别 下 述 语言 的 连接 的 NFA 的 状态 图 。 

a. 练习 1. 6g 和 1. 6i 中 的 语言 。 b. 练习 1. 6b 和 1. 6m 中 的 语言 。 


使 用 定理 1. 24 证 明 中 的 构造 ， 给 出 识别 下 述 语言 的 星 号 的 NFA 的 状态 图 
a. 练习 1. 6b 中 的 语言 。 b. 练习 1. 6j 中 的 语言 。 ce 练习 1. 6m 中 的 语言 。 
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证 明 每 一 台 NFA 都 能 够 被 转换 成 只 有 一 个 接受 状态 的 等 价 NFA. 

S D={w w 含有 偶数 个 a 和 奇数 个 b 并 且 不 包含 子 串 ab} 。 画 出 识别 D 的 5- 状 态 的 DFA 图 和 

生成 D 的 正则 表达 式 。( 建 议 尽 量 简 单 地 描述 D.) 

令 下 是 {0,1) 上 所 有 串 构 成 的 语言 ， 并 且 下 中 任意 两 个 1 之 间 间 隔 的 符号 数 都 不 是 奇数 。 画 出 

识别 下 的 5- 状态 的 DFA 图 。( 先 找 一 个 4- 状态 的 NFA 作 下 的 补 集 可 能 有 助 于 求解 问题 。) 

a. WH: £M 是 一 台 识 别 语言 B 的 DFA， 交 换 M 的 接受 状态 与 非 接 受 状 态 得 到 一 台新 的 DFA, 
则 这 台新 DFA 识别 B 的 补 集 。 因 而 ,正则 语言 类 在 补 运算 下 封闭 。 

b. 举例 说 明 : 2 M 是 一 台 识 别 语言 C 的 NFA， 交 换 M 的 接受 状态 与 非 接受 状态 ， 得 到 一 台新 
NFA， 这 台新 NFA 不 一 定 识 别 C 的 补 集 。NFA 识别 的 语言 类 在 补 运 算 下 封闭 吗 ? 并 解释 
回答 。 

给 出 一 个 反例 ， 说 明 下 述 构造 不 能 证 明定 理 1.24， 即 正则 语言 类 在 星 号 运算 下 封闭 9 。 设 

N; =(Q 5250159, Fi) 识别 Al 。 如 下 构造 N= 二 (QQ ðq ;F)。NN 应 该 识别 Ar. 

a. N 的 状态 集 是 Ni 的 状态 集 。 

b. N 的 起 始 状 态 与 Ni 的 起 始 状 态 相 同 。 

e Fetq UP. 

F 的 接受 状态 是 原来 的 接受 状态 加 上 它 的 起 始 状态 。 

d. 定义 6 如 下 : 对 每 一 个 g€ Q 和 每 一 个 a€ 3， 

01 (qsa) q¢ Fi Kafe 

0i(q,a)U{q,} gE Fi Rase 

(建议 : 把 这 个 构造 转换 成 图 ， 如 图 1- 26 ra.) 

使 用 定理 1. 19 给 出 的 构造 ， 把 下 图 的 两 台 非 确定 型 有 穷 自动 机 转换 成 等 价 的 确定 型 有 穷 自动 机 。 


(gqg,a) = | 





a. 给 出 识别 语言 (01U001U010)* 的 NFA, 

b. 将 给 出 的 NFA 转换 成 等 价 的 DFA。 给 出 在 该 DFA 开始 状态 可 达 的 部 分 即 可 。 

给 出 生成 练习 1. 6 中 语言 的 正则 表达 式 。 

使 用 引 理 1. 29 中 描述 的 过 程 ， 把 下 述 正则 表达 式 转 换 成 非 确定 型 有 穷 自动 机 。 

a. (0U1)* 000(0U1)* b. (((00) * (11)) U01)* C g” 

对 于 下 述 每 一 个 语言 ， 给 出 4 个 字符 串 ， 其 中 2 个 是 这 个 语言 的 成 员 ，2 个 不 是 这 个 语言 的 成 
员 。 这 里 假设 字母 表 3 一 {a,b}。 


b.a (ba)* b 

c.a* Ub* d. (aaa) * 

¢. Z* ad" bha" as" f. aba U bab 

g. CeUa)b h. (aU baU bb) * 


使 用 引 理 1. 32 中 描述 的 过 程 ， 把 下 图 的 有 穷 自 动机 转换 成 正则 表达 式 。 


换 名 话说， 必须 给 出 一 台 有 穷 自动 机 Ni ， 关 于 它 构 造 出 来 的 自动 机 N 不 识别 Ni 的 语言 的 星 号 。 


1.22 


a 
1. 24 
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在 某 些 程序 设计 语言 中 ， 注 释 出 现在 两 个 分 隔 符 之 间 ， 如 : /H# AH /. RCRA AMER R 
的 语言 。C 中 的 成 员 必 须 以 /# 开 始 、#/ 结 束 ， 并 且 在 开始 和 结束 之 间 没 有 #/。 为 简便 起 见 ， 
假设 CAFE T= {a,b,/,#}. 

a. 给 出 识别 C 的 DFA. b. 给 出 生成 C 的 正则 表达 式 。 

设 B 是 字母 表 上 的 任 一 语言 。 证 明 B=Bt 4 HA4 BBSB。 

有 穷 状态 转换 器 (FST) 是 确定 型 有 穷 自 动机 的 一 种 类 型 。 它 的 输出 是 一 个 字符 串 ， 而 不 仅仅 是 
接受 或 拒绝 。 下 图 是 两 台 有 穷 状态 转换 器 TI 和 Tz 的 状态 图 。 





FST 的 每 一 个 转移 用 两 个 符号 标记 ， 一 个 指明 该 转移 的 输入 符号 ， 另 一 个 指明 输出 符号 。 两 个 
符号 之 间 用 斜 杠 /把 它们 分 开 。 在 Ti H, Mq 到 g, 的 转移 有 输入 符号 2 和 输出 符号 1。 某 些 转 
移 可 能 有 多 个 输入 -输出 对 ， 例 如 TI 中 从 @ 到 它 自身 的 转移 。 当 FST 在 对 输入 串 岂 计算 时 ， 从 
起 始 状 态 开始 ， 一 个 接 一 个 地 取 输 入 符号 wi…w。， 并 且 比 照 输 入 标记 和 符号 序列 wi…w = w 
进行 转移 。 每 次 沿 一 个 转移 走 一 步 ， 输 出 对 应 的 输出 符号 。 例 如 ， 对 输入 2212011， 机 器 Ti 依 
次 进入 状态 go ,9, 045 yo 0 0) 09, 和 输出 1111000。 对 输入 abbb, T: 输出 1011。 给 出 在 下 述 
每 一 小 题 中 机 器 进入 的 状态 序列 和 产生 的 输出 。 


a. Tı 对 输入 串 011 b. Tı 对 输入 串 211 c. Ti 对 输入 串 121 
d. Tı Xt #7 AB 0202 e. T2 Xt #7 AB b f. T。 XJA AB bbab 
g. T: 对 输入 串 bbbbbb h. T: 对 输入 串 e 


见 练习 1. 24 中 给 出 的 有 穷 状 态 转换 器 的 非 形式 化 定义 。 仿 照 定 义 1.1 (1.1.1 节 ) 的 模式 ， 给 出 
这 个 模型 的 形式 化 定义 。 假 设 FST 的 输入 字母 表 为 >、 输 出 字母 表 为 政 ， 但 没有 接受 状态 集 。 包 
括 FST 的 计算 的 形式 化 定义 在 内 。 (提示 : 一 台 FST 是 一 个 5 元 组 ， 它 的 转移 函数 形 如 6:QX 
5—>QXT,) 

参见 练习 1. 25 的 解决 方案 ， 给 出 练习 1.24 中 画 出 的 机 器 Ti 和 T 的 形式 化 描述 。 

参见 练习 1.24 中 给 出 的 有 穷 状 态 转 换 器 的 非 形 式 化 定义 。 给 出 一 台 具 有 下 述 行为 的 FST 的 状态 
图 。 它 的 输入 、 输 出 字母 表 都 是 {0，1)。 它 输出 的 字符 串 与 输入 字符 串 在 偶数 位 相同 、 奇 数位 
相反 。 例 如 ， 对 于 输入 0000111， 它 应 该 输出 1010010, 

使 用 定理 1. 28 给 出 的 过 程 将 下 述 正则 表达 式 转 换 成 NFA。 在 所 有 问题 中 Z= {a,b}. 


a. a(abb) * Ub b. at U (ab) + č. (aU bT Dat bt 
使 用 有 泵 引 理 证 明 下 述 语言 不 是 正则 的 。 
Ag, Ay = {0"]1*2" |n>0} b. As ={ww w|wE {a,b}* } 


Ae, A3={a? |n>0} GX # az 表示 2" 个 a 构成 的 串 ) 
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指出 下 述 关 于 0* 1* 不 是 正则 语言 的 “证 明 ” 的 错误 (由 于 0* 1* 是 正则 语言 ， 所 以 “证 明 ” 存 
在 错误 ): 用 反 证 法 证 明 。 假 设 0* 1* 是 正则 的 。 设 p 是 泵 引 理 给 出 的 关于 0* 1* 的 泵 长 度 。 选 
FE s AB 0?1?。 已 知 s 是 0*1* 的 一 个 成 员 ,， 但 例 1. 38 表明 s 不 能 被 抽取 。 这 样 得 到 矛盾 。 因 此 
0*1* 不 是 正则 的 。 


对 语言 A 和 语言 B, RAMB 的 完全 间隔 交叉 (perfect shuffle) 为: 

{wlw= 二 a1b1… apbr ,其 中 a1… ar EA 并 且 b1… br EB, E— aibi ES) 
证 明 : 正则 语言 类 在 完全 间隔 交 又 下 封闭 。 
对 语言 A 和 语言 B, 设 A 和 B 的 间隔 交叉 (shuffle) X: 

{w|w=a,b)°** arb, $ F art a EA 并 且 b1:… bi EB, 任 一 a;,b; E25*)} 
证 明 : 正则 语言 类 在 间隔 交叉 下 封闭 。 
设 A 为 任意 语言 。 定 义 DROPOUT(A) 得 到 的 语言 包含 的 串 都 是 A 中 的 串 移 除 一 个 符号 后 得 
到 的 。 这 样 ，DROP-OUT(A)=={zxz|zxzyzE A, 其 中 x,zE53* ,y€E535)}。 证明: 正则 语言 类 在 运算 
DROP-OUT 下 封闭 。 像 定理 1. 23 一 样 ， 用 图 给 出 一 个 证 明 ， 再 通过 构造 给 出 一 个 更 形式 化 的 
证 明 。 
设 B 和 C 是 = (0, 1) 上 的 语言 。 定 义 

B<C={wE B| 对 于 菜 个 yEC, 串 ww 和 yy 含有 同样 个 数 的 1) 

证 明 ， 正 则 语言 类 在 运算 < 下 封闭 。 
i A/B= {w| 对 于 某 XE Be,wxrE A). 证 明 如 果 A 是 正则 的 ，B 是 任意 语言 那么 A/B 是 正 
则 的 。 
对 于 任意 的 字符 串 w=w w ewn, w 的 反 转 是 按 相反 的 顺序 排列 w 得 到 的 字符 串 ， 记 作 wr, 
即 wR = 二 w,… wz wl 。 对 于 任意 语言 A, B AR = 二 {wR |wE€ A})。 
证 明 : 如 果 A BEM, WAHEED. 


EEE 


zs 包含 所 有 高 度 为 3 的 0 和 1 的 列 。53 上 的 字符 串 给 出 三 行 0 和 1。 把 每 一 行 看 作 一 个 二 进 制 
数 ， 令 
B={wE z; * |w 最 下 面 的 一 行 等 于 上 面 两 行 的 和 ) 


ot ta 1 
“EB 
L3 Od LD ba) dl 
证 明 B 是 正则 的 (提示 : EH B* 是 正则 的 会 容易 一 些 。 假 设 已 知 问题 1.36 中 的 结果 ) 。 
设 
0 0 1 1 
io} hh bl bl) 


ZE, 2 包括 所 有 高 度 为 2 的 0 和 1 的 列 。3。 上 的 字符 串 给 出 两 行 0 和 1。 把 每 一 行 看 作 一 个 
二 进 制 数 ， 令 


例如 ， 





C= {wE32 | ww 下面 一 行 是 上 面 一 行 的 3 倍 )} 
例如 ， 


re 


. 41 
.42 
.43 


pi jz 


Al. 46 


A* 1.48 


1. 49 
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证 明 C 是 正则 的 。( 可 以 假设 已 知 问 题 1. 36 中 的 结果 。) 
设 3 与 问题 1. 38 中 的 相同 。 把 每 一 行 看 作 是 一 个 二 进 制 数 ， 并 且 设 
D={wE Z: * |w 上 一 行 表示 的 数 大 于 下 一 行 表 示 的 数 } 


| oll Jie se Je 


设 5 与 问题 1. 38 中 的 相同 。 把 上 、 下 行 都 看 作 是 0 和 1 的 字符 串 ， 并 且 设 
E={wE z: * |w 的 下 一 行 是 上 一 行 的 反 转 ) 


例如 ， 


HEAR E REEK. 
it B,={a' |k fen 的 整数 倍 }。 证 明 : 对 每 一 个 n 宇 1， 语言 B, 是 正则 的 。 
设 C,=(z\2 是 一 个 二 进 制 数 , 且 是 的 整数 倍 }。 证 明 : 对 每 一 个 n 宇 1， BSC, 是 正则 的 。 
一 台 全 路 径 NFA (all-NFA) M 是 一 个 5 元 组 (Q.X. F). MR MI rE” 的 每 一 个 可 能 
的 计算 都 结束 在 下 中 的 状态 ， 则 M 接受 x+。 注意 ， 相 反 地 ， 普 通 NFA 只 需 有 一 个 计算 结束 在 接 
受 状态 ， 就 接受 这 个 字符 串 。 证 明 : 全 路 径 NFA 识别 正则 语言 类 。 
定理 1. 28 中 的 构造 表明 ， 每 一 个 GNFA 都 等 价 于 一 个 只 含 两 个 状态 的 GNFA。 对 DFA, AA 
RAMA. WEA: 对 每 一 个 &>1， 都 有 语言 A 守 {10,1}* 能 被 一 个 个 状态 的 DFA 识别 ， 但 不 
能 被 只 有 & 一 1 个 状态 的 DFA 识别 。 
如 果 存 在 字符 串 = 使 得 zz 一 >， 则 称 字 符 串 CESAR y WA (prefix), WR r Æ y WAAAH 
sAy, WH z 是 y HAA (proper prefix) 。 下 面 每 小 题 定 义 一 个 语言 A 上 的 运算 。 证 明 : E 
则 语言 类 在 每 个 运算 下 封闭 。 
Aa. NOPREFIX(A)= {wE Alw 任 一 真 前 级 都 不 是 A 的 元 素 ) 

b. NOEXTEND(A)= {wE A| w PEA 中 任何 字符 串 的 真 前 组 } 
参见 练习 1. 24 中 给 出 的 有 穷 状态 转换 器 的 非 形 式 化 定义 。 证 明 不 存在 对 每 一 个 输入 w 都 能 输出 
wR 的 FST， 其 中 输入 和 输出 字母 表 为 {0,1}. 
Hr My RAS SAR, 是 一 个 语言 。 如 果 存 在 字符 串 z， 使 得 zz 和 yz 中 恰好 有 一 个 是 LL 的 
成 员 ， 则 称 x 和 y 是 用 L 可 区 分 的 ; 否则 ， 对 每 一 个 字符 串 z, rz 和 yz 要 么 都 是 、 要 么 都 不 是 
L 的 成 员 ， 则 称 xz 和 yy 是 用 L 不 可 区 分 的 。 如 果 xz 和 y 是 用 L 不 可 区 分 的 ， 记 作 x 三 Ly。 证 明 
= 三 5 是 一 个 等 价 关 系 。 
Myhill-Nerode 定理 。 参 见 问 题 1.47， 设 工 是 一 个 语言 ，X 是 一 个 字符 串 集合 。 如 果 XX 中 的 任意 
两 个 不 同 的 字符 串 都 是 用 工 可 区 分 的 ， 则 称 X 是 用 工 两 两 可 区 分 的 。 定 义工 的 指数 为 用 工 两 两 
可 区 分 的 集合 中 的 元 素 个 数 的 最 大 值 。 工 的 指数 可 能 是 有 穷 的 或 无 穷 的 。 
a. 证 明 : 如 果 工 被 一 台 有 上 个 状态 的 DFA 识别 ， 则 工 的 指数 不 超过 &。 
b. 证 明 : 如 果 工 的 指数 是 一 个 有 穷 数 k， 则 它 被 一 台 有 个 状态 的 DFA 识别 。 
c. 由 此 得 到 : 工 是 正则 的 当 且 仅 当 它 有 有 穷 的 指数 。 而 且 ， 它 的 指数 是 识别 它 的 最 小 DEFA 的 

大 小 。 

考察 语言 F= {abit |i j k>0, FAA i=1, W] j=k}. 
a. 证 明 下 不 是 正则 的 。 
b. 用 泵 引 理 说 明 下 是 一 个 正则 语言 。 即 对 于 一 个 给 定 的 泵 长 度 p,， 下 满足 泵 引 理 的 三 个 条 件 。 
c. 解释 为 什么 (a) Al (bd) 与 泵 引 理 不 矛盾 。 
泵 引 理 指出 ， 对 每 一 个 正则 语言 都 有 一 个 泵 长 度 p， 使 得 对 于 该 语言 中 每 一 个 字符 串 ， 如 果 它 的 
长 度 等 于 或 大 于 p 就 能 够 被 抽取 。 如 果 p 是 语言 A 的 泵 长 度 ， 则 任意 的 p' 宇 p 也 是 A WRK 
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度 。A 的 最 小 泵 长 度 是 A 的 泵 长 度 的 最 小 值 。 例 如 ， 如 果 A 二 01* ， 则 最 小 泵 长 度 等 于 2。 理 由 
wF: A 中 长 度 为 1 的 字符 串 ;= 二 0 不 能 被 抽取 ， 而 A 中 任何 长 度 大 于 等 于 2 的 字符 串 都 含有 1， 
把 它 划 分 成 z= 二 0，y 二 1，z 为 其 余部 分 ， 从 而 能 够 被 抽取 。 对 于 下 述 语言 ， 给 出 最 小 泵 长 度 ， 
并 加 以 证 明 。 


Aa. 0001* a 0* 1* ce. 001U0* 1* 
ae O* 19" 1* Uoti e. (01) * fé 
21° O01" OL" 有 OO i. 1011 
i E 
证 明 下 述 语言 不 是 正则 的 。 证 明 可 以 使 用 泵 引 理 和 正则 语言 类 在 并 、 交 、 补 运算 下 封闭 的 性 质 。 
a. {0"1"0"|m,n>0} Ab, {07 1" | myn} 
c. {w| we {0,1}* 不 是 一 个 回 文 }9 *d. (wtw|w,tE {0,1}+} 


wW>={1,4#} UR 
Y={w| 3t k20,2,E€1* H ify Hz: Axj,w=271 #r:# e #rr? 
证 明 : Y 不 是 正则 的 。 
u S={0,1} 以 及 
D={wlw 中 子囊 01 和 子囊 10 的 出 现 次 数 相等 ) 
由 于 101 含有 一 个 01 和 一 个 10， 因 此 101ED。 而 1010 含有 两 个 10 和 一 个 01， 所 以 1010ED, 
证 明 : DD 是 正则 语言 。 
设 5={a,b)。 对 每 一 个 k 宇 1， 设 Cs 是 由 所 有 从 右 端 起 第 & 个 位 置 是 a 的 串 组 成 的 语言 。 这 样 
Ci 二 3* ad!) 。 分 别 用 状态 图 和 形式 化 描述 的 方法 描述 识别 Ce 的 有 上 十 1 个 状态 的 NFA. 
考虑 问题 1. 54 中 定义 的 语言 Ce 。 证 明 对 每 一 个 &， 没 有 状态 数 小 于 2* 的 DFA 识别 C. 
设 3= {a,b}) 。 对 每 一 个 21, WD, 是 由 所 有 最 后 个 符号 中 至 少 含 一 个 a 的 串 组 成 的 语言 。 这 样 
Di 二 3* a(5Ue)*-!1。 分 别 用 状态 图 和 形式 化 描述 的 方法 描述 识别 D 上 且 最 多 有 & 十 1 个 状态 的 DFA, 
a 设 A 是 无 穷 正 则 语言 。 证 明 : A 能 够 被 拆 分 成 两 个 不 相交 的 无 穷 的 正则 子 集 。 
b. EBA DEWNER. WR BCD 并且 DD 无 穷 地 包含 所 有 不 在 Bp pH, Mi BED., W 
明 : 如 果 B 和 DD 是 两 个 正则 语言 且 BED, 那么 可 以 找到 一 个 正则 语言 C， 使 得 BEC ED。 
设 N 是 识别 某 语言 A 的 一 台 含 & 个 状态 的 NFA。 
a. 证 明 : 如 果 A 非 空 ， 则 A 含有 的 串 的 长 度 最 大 为 。 
b 通过 举例 说 明 : 如 果 将 (a) 中 的 两 处 A RHA, W (a) 不 一 定 为 真 。 
c 证 明 : WRAS, WMA SAMWBWKEBKH 2, 
d. 证 明 (c) 中 给 出 的 边界 是 相当 紧密 的 。 即 对 每 一 个 &， 证 明 NFA 识别 语言 At， 其 中 A 是 非 
室 的 并 且 Ax 中 最 短 的 成 员 串 的 长 度 是 & 的 指数 。 与 〈c) 中 的 边界 非常 接近 。 
证 明 : 对 每 一 个 n>0, 语言 B, 都 存在 ， 其 中 
a. B, 被 含有 7? 个 状态 的 NFA 识别。 
b. 对 正则 语言 A, WE B, =A U…UAk ， 那 么 至 少 有 一 个 A; 需要 含有 指数 级 个 数 状态 的 DFA. 
EA (homomorphism) 是 从 一 个 字符 集 经 过 男 一 个 字符 集 到 字符 串 的 函数 Sf: S-T*. EM 
fC w) = flw) fw.) flan) 将 ff 扩展 为 在 字符 串 上 的 操作 ， 其 路 = 二 wiw2z…w FHA wE. 
进一步 ， 对 任意 语言 A， 定义 f(A)={f(w)|wE€ A} 将 了 扩展 为 对 语言 的 操作 。 
a 通过 形式 构造 证 明 : 正则 语言 类 在 同 态 下 封闭 。 换 言 之 ， 给 定 一 个 识别 BM DFA M 和 同 态 
f， 构 造 一 个 识别 fCB) 的 有 穷 自动 机 M 。 考 虑 你 构造 的 机 器 M ， 是 否 在 所 有 情况 下 它 都 是 
一 个 DFA? 


回 文 (palindrome) 是 顺 着 读 和 倒 着 读 都 一 样 的 字符 串 。 
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. 69 
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b. 通过 一 个 例子 证 明 : 非 正则 语言 类 在 同 态 下 不 封闭 。 
设 语言 A 的 旋转 闭 包 (rotational closure) H RC(A)=({yz|zryEA}. 
a. 证 明 : 对 任何 语言 A，RC(A) 王 RCCRC(CA) ) 。 
b. 证 明 : 正则 语言 类 在 旋转 闭 包 下 封闭 。 
设 3=({0,1, 十 , 王 ) 以 及 
ADD={(z=y 十 z|z,y,z 是 二 和 进 制 整数 ,并 且 工 是 y 与 z 的 和 和) 
证 明 ADD 不 是 正则 的 。 
若 A 是 一 个 自然 数 的 集合 , & 是 大 于 1 的 自然 数 ， 令 
B(A)={wlweA 中 某 个 数 以 k 为 底 的 表示 ) 

这 里 不 允许 数 的 表示 以 0 开头 。 例 如 ，B2({3,5)) 二 {11,101},B3((3,5)) 二 {10,12}。 给 出 一 个 
RAA, EBA) 是 正则 的 ， 而 BA 不 是 正则 的 ， 并 加 以 证 明 。 
若 A 是 任 一 语言 , 令 AL 是 A 中 字符 串 的 前 半 段 组 成 的 集合 ， 腿 

Al —{z| STR? ylz = |y i ayes) 
证 明 : WR A 是 正则 的 ， 那么 AL 也 是 正则 的 。 
若 A 是 任 一 语言 , 令 4A4 -1+ 是 A 中 所 有 字符 串 删 去 中 间 的 三 分 之 一 后 得 到 的 字符 串 组 成 的 集 
a, BD 

A1_-1=({z2z| FEF ylz = [zmz] H zyz€ A} 
WHA: WR A 是 正则 的 ， 那么 A4-+4 不 一 定 是 正则 的 。 
设 M=(Q,3,6,go,F) 是 一 个 DFA 并 且 M 的 状态 h 称 为 它 的 “家 ”。M 和 六 的 同步 序列 〈syn- 
chronizing sequence) 为 串 s，sEY* ， 其 中 对 每 一 个 g€ Q,6(g,s) 二 hh。( 这 里 已 经 把 6 扩展 成 串 ， 
因此 6(g,s) 等 于 当 M 从 状态 g 开始 ， 读 入 输入 s 的 结束 状态 .) 如 果 对 某 个 状态 h，M 有 一 个 同 
步 序 列 ， 那 么 称 M 是 可 同步 的 (synchronizable)。 证 明 : 如 果 M 是 一 台 -状态 的 可 同步 的 
DFA ， 那 么 它 有 一 个 长 度 最 大 为 及 的 同步 序列 。 试 试 增 大 这 个 边界 。 
对 语言 A 和 语言 B， 定 义 avoids 运算 如 下 : 
A avoids B 二 {wl|wE€EA 和 并且 B 中 的 任何 字符 串 都 不 是 A 的 子 串 ) 

证 明 : 正则 语言 类 在 avoids 运算 下 封闭 。 
设 3={0,1}， 
a. 若 A 二 {0tu0* |k>1 并 且 w€E3* }。 证 明 ; A 是 正则 的 。 
b. 若 B 二 {0t*1u0*|k 宇 1 并 且 uwE€53* }。 证 明 : B 不 是 正则 的 。 
设 Mi 和 M: 是 分 别 包 含 ki 和 kz 个 状态 的 两 个 DFA, 设 U=L(Mi)ULCM;)。 
a. WEH: 如 果 U 头 多， 那么 U 包含 长 度 小 于 max(k1，kz) 的 字符 串 。 
b. WH: 如 果 U 关 5* ， 那 么 U 不 包含 长 度 小 于 kik2 的 字符 串 。 
设 S=—(0,1,#}, ti eek {051 HERR: C 是 上 下 文 无 关 语 言 (CFL). 
a. 设 B 二 {lty|y€E {0,1}* ， 并且 对 k 宇 1，y 含有 至 少 & 个 1}。 证 明 : B 是 正则 语言 。 
b. 设 C={1ty|y€E10,1}* ， 并 且 对 上 宇 1，y 含有 至 多 k 个 1}。 TEM: C 不 是 正则 语言 。 
传统 切 牌 方法 将 一 副 纸牌 随意 分 成 两 部 分 ， 交 换 后 再 重新 组 合成 一 副 牌 。 更 复杂 点 的 方法 被 称 为 
Scarne 切 牌 ， 首先 将 一 副 牌 分 成 3 部 分 ， 重 新 组 合 时 将 中 间 那 部 分 放 在 最 上 面 。 受 Scarne 切 牌 
启发 ， 定 义 一 种 对 语言 的 操作 。 对 语言 A, w CUT(A)={yxz|ryz€ A}. 
a. 给 出 一 个 语言 B 满 足 CUT(B) 关 CUT(CUT(B)).， 
b. 证 明正 则 语言 类 在 CUT 操作 下 封闭 。 
设 3={0,1}，WWi 二 {ww|wE€ 5* 并 且 w 的 长 度 为 k&}。 
a. 证 明 无 论 & 取 何 值 ， 所 有 状态 数 少 于 2* 的 DFA 都 不 能 识别 WW, . 
b. 描述 一 个 状态 更 少 的 能 识别 WW (WW, 的 补 集 ) 的 NFA. 
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习题 选 解 


1.1 X Mi: aq; b {qo}s © qiga qily9l1; G 不 接受 ; e 不 接受 。 
对 Me: a.q; b. (gq, qi}; ec.qlyqlyqlyqy ,44; d. 接受 ; e. 接受 。 
1.2 Mi =({q, vg 943} {arb} sôi +g, 9 {G2 }) 
M2 = (qq +2 293 94} 9 {asb} 902 3q; 91, 44)) 
转移 函数 分 别 为 : 





1.4 b. 语言 (w| wf AE? ^a 和 语言 (w| ww 含有 人 至少 2 个 b} 的 DFA 如 下 所 示 : 


b b a, b a a a, b 
f 全 y $e 篇 R fad 
Baf. ene O00 


使 用 自动 机 的 交 运 算 构 造 出 如 下 DFA: 





d. 语言 《让 | 也 含有 偶数 个 a)} 和 语言 (wlw 中 每 个 a 后 都 跟 有 至 少 一 个 b} 的 DFA 如 下 所 示 : 


a > b a a,b 
-O< O A aoe 
a b 


使 用 自动 机 的 交 运 算 构 造 出 如 下 DFA: 





虽然 问题 并 没有 要 求 简 化 DFA， 但 可 以 合并 某 些 状态 ， 得 到 : 





1.7 


0, 1 
E 
11 


f. 
Cd am’ 


1. 


4 
设 N= 二 (Q,5,6,qo F 为 任 一 NFA。 构 造 一 个 只 有 一 个 接受 状态 的 NFA N', ES N 接受 同样 的 
语言 。 非 形式 地 讲 ，N 与 N 很 相近 ,但 是 N 从 相对 于 ON 是 接受 状态 的 状态 到 新 的 接受 状态 recept 
有 ee 转移 。 状态 qaccent 上 没有 新 的 转移 。 形式 地 讲 ， N = (QU oe } rod yi ’ (at 29 其 中 对 
每 一 个 ge Q All a € p 9 


ð (q,a)= 


0(q,a) 
并 且 对 每 一 个 a€ 5. q 


6(g,a) U {q 
accep 


t sa) =Ø 
1.23 证 明 “ 当 且 仅 当 ” 的 两 个 方向 : 


如 果 axe KQEF 
ii 
(一 ) 假设 B=B+ ， 证 明 BBCB, 
由 于 对 所 有 语言 BBCBt 成立， 因此 如 果 B=Bt, 那么 BBCB, 
(<) 假设 BBCB, WH B=B., 


由 于 对 所 有 语言 有 BCB* ， 所 以 只 需要 证 明 BtB, WR wEB, RA w= 二 zx1x2… xz， 其 中 每 
© B* SB, 


—+27,€BFARES1. AX rı, 2.€ BHA BBCB, AMA rır: €B. KWH, AF rizr: Æ B 
PHA zs 也 在 BP, AMA zir: r EB. UŽE, rie r CB. AW wEB, FETISA 
后 半 部 分 的 论证 可 以 用 如 下 的 归纳 证 明 形 式 化 地 描述 : 

假设 BBCB, 


GIF EM 


N 


f 


y 


Wh 


59 


60 


1. 29 


1. 34 


1. 45 


B-RA BDMG 


WA: ME— T kl, WMR zis “s EB, PA tr EB. 

归纳 基础 : 当 &A=1 时 ， 陈 述 显 然 成 立 。 

归纳 步骤 ， 对 每 一 个 有 宇 1， 假设 断言 在 & 时 成 立 。 证 明 A+ 1 时 也 成 立 。 

如 果 zi1，…，Zzs，Zz4r+1EB， 那 么 根据 归纳 假设 zi… xi EB， 有 zi… xixzi+1EBB, 但 BBCB, 
因此 rie zs+1E€B。 这 样 就 证 明了 归纳 步骤 和 断言 。 该 断言 指出 ， 如 果 BBCB, 那么 BtCB, 


a. 


假设 A; ={0"1"2"|n>0} 是 正则 的 。 设 p 是 泵 引 理 给 出 的 泵 长 度 。 选 择 * 为 串 0*1222。 由 于 s 

是 Ai 的 一 个 成 员 并 且 sk p 更 长 ， 泵 引 理 保证 :可 以 被 划分 成 3 片 ，s 二 zyz， 其 中 对 任意 iS 

0, $ zyz ÆA, 中 。 考 虑 下 面 两 种 可 能 性 : 

1. $ y 仅 由 0 组 成 ， 仅 由 1 组 成 ， 或 者 仅 由 2 组 成 。 在 这 些 情况 下 ， 串 zyyz 将 不 会 有 等 数量 
的 0，1 和 2。 因 此 zyyz 不 是 Ai WRR, 矛盾 。 

2. Fy 由 不 止 一 种 符号 组 成 。 在 这 种 情况 下 ， 串 zyyz 将 含有 次 序 不 定 的 0，1 或 2。 因 此 zyyz 
不 是 Ai WRR, FE. 

两 种 可 能 性 得 到 的 都 是 矛盾 。 因 此 ，Ai 不 是 正则 的 。 


. 假设 As = {a | n 宇 0} 是 正则 的 。 设 p 是 泵 引 理 给 出 的 泵 长 度 。 选 择 * 为 串 a” 。 由 于 是 As 


的 一 个 成 员 并 且 sk p 更 长 ， 泵 引 理 保证 s 可 以 被 划分 成 3 片 ，s= 二 xyz， 满 足 泵 引 理 的 三 个 
条 件 。 

第 三 个 条 件 说 明 | zy | <p. Wb p 二 2* ， 可 见 | y| 二 22。 因 此 |zyyz| 王 |zyz| 十 |y| 运 22 十 
22 一 22 1 。 第 二 个 条 件 要 求 |y| 盖 0， 于 是 2°<|cyyz|<2?t!, OH zyyz 的 长 度 不 可 能 是 2 的 
某 次 方 。 因 此 zyyz 不 是 As WMA, FA. AM, A 不 是 正则 的 。 


设 DFA Mp 一 (QB ,2,08,qp，FsB) 和 DFA Mc 二 (Qc ,3,6c ,qc，Fc) 分 别 识别 B 和 C。 按 如 下 方式 


构造 识别 B-C 的 NFA M 一 (Q,3,6,g, ,F)。 为 了 确定 其 输入 w BBE BCH, 机 器 M 要 检查 
wEB， 并 且 并 行 、 非 确定 地 猜测 和 由 含有 同样 个 数 1 的 串 y 并且 检查 VEC, 


2. 


1. Q—= QB XQc. 
对 (gq,7)EQ 和 aE€3， 定义 
{Cg (qs0) 357)} 如 果 a=0 
ellar) a) =< (1(6p(gs1),6c(r,1))} wmRa=l1 
{(qsdc(r,0))} 如 果 a=e 


3: dy = p sfp] 
4. FÆFg XFce. 


设 M=(Q,3,0,q.F) 是 识别 A 的 一 台 DFA， 其 中 A 是 某 正 则 语言 。 按 如 下 方式 构造 识别 
NOPREFIX(A) 的 M=(Q 38 ao F): 

1. Q =Q. 

en {O(r,a)} WMR rF 

2. 对 rEQ Macs, 定义 6 (r,a)= 5 如 果 EF 
3. do = We 

LF =F, 


假设 相反 : 存在 某 个 FST TERA w we, A 00 和 01。 对 于 输入 00, T 必定 输 
出 00， 对 于 输入 01， 工 必定 输出 10。 在 这 两 种 情况 下 ， 输 入 的 第 一 位 都 是 0， 但 输出 的 第 一 位 却 
不 一 样 。 对 于 FST 来 说 是 不 可 能 这 样 操作 的 ， 因 为 FST 在 读 入 第 二 位 输入 之 前 就 要 产生 第 一 位 输 
出 。 因 此 不 存在 这 样 的 FST. 

1.48 a 用 反 证 法 证 明 该 断言 。 令 M 为 一 识别 工 的 -状态 DFA。 假 设 相 反 : 工 的 指数 大 于 &。 这 就 意味 


着 某 个 元 素 个 数 大 于 的 集合 X BRL 两 两 区 分 。 由 于 M 有 & ARS, WEER, X 
含有 两 个 不 同 的 串 z 和 y， 其 中 6(g, ,7) 二 6(go,y)。 这 里 6(go ,7x) 是 M 从 起 始 状 态 g。 出 发 在 


1. 50 
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读 和 人 输入 串 过 后 所 在 的 状态 。 那 么 ， 对 任意 串 zE3* ，6(g, rz) =q yz). Am zz 和 yz 要 
么 都 在 L 中 ， 要 么 都 不 在 工 中 。 但 这 样 zx 和 yy 不 再 被 二 区分， 与 假设 的 X RL 两 两 区 分 矛盾 。 


-BX={n ss) 被 了 两 两 区 分 。 构 造 识 别 工 的 有 & 个 状态 的 DFA M=, Zg F). & 


Q 二 {qi ，… ,qi} 并 且 定 义 6(gq;,a) Ag, HP sE sa KA=_HEX RAB 1. 47)。 注 意 对 
F s; EX,sj 三 L sia; 否则 ，XU sia 可 能 含有 十 1 个 元 素 并 且 被 二 两 两 区 分 ， 这 会 与 假设 工 的 
指数 为 & 相 矛盾 。 设 上 = {q| s; EL}， 起 始 状 态 q X qo XIE s=. Wie M 使 得 对 任 一 状 
AS q;9 (sll) =q;}={sls=_si}. Ale MRI L 


. 假设 工 是 正则 的 ， 并 且 令 & 是 识别 工 的 DFA 的 状态 数 。 那 么 根据 (a) 可知 工 的 指数 的 最 大 值 为 


&。 相 反 ， 若 工 的 指数 为 &， 那 么 根据 O 可 知 它 被 有 上 个 状态 的 DFA 识别 ， 因 而 是 正则 的 。 为 
了 证 明 工 的 指数 是 接受 它 的 最 小 DFA 的 大 小 ， 假 设 工 的 指数 恰好 是 &。 那 么 ， 根 据 〈b) ， 存 在 一 
个 接受 工 的 人 状态 DFA。 这 是 最 小 的 DFA， 因 为 如 果 还 有 更 小 的 ， 就 可 以 根据 Ca) 证 明 工 的 
指数 小 于 A。 


. 最 小 的 泵 长 度 为 4。 捉 000 在 语言 中 但 不 能 被 抽取 ， 因 而 这 个 语言 的 泵 长 度 不 是 3。 如 果 s 的 长 


度 为 4 或 更 长 ， 则 它 包含 1 在 其 中 。 通 过 将 ;划分 为 zyz， 其 中 工 是 000，y 是 第 一 个 1，z 是 其 
后 的 所 有 符号 ， 可 以 满足 泵 引 理 的 三 个 条 件 。 


. 最 小 的 泵 长 度 为 1。 由 于 捉 e 在 语言 中 并 且 不 能 被 抽取 ， 因 而 泵 长 度 不 可 能 是 0。 语言 中 的 每 一 


个 非 空 串 都 能 被 划分 为 zxyz， 其 中 工 是 se，y 是 第 一 个 字符 ，z 是 剩 下 的 部 分 。 该 划分 满足 有 泵 引 
理 的 三 个 条 件 。 


-RNRKEA 3. AFR 11 在 语言 中 并 且 不 能 被 抽取 ， 因 而 泵 长 度 不 可 能 是 2。 设 :是 在 语言 


中 长 度 至 少 为 3 的 串 。 如 果 s 由 0*1+0+1* 生 成 ,并 且 s 以 0 或 11 开始 ， 写 作 ;= 二 z+yz， 其 中 
ZX 二 e，y 是 第 一 个 符号 ，z 是 ;的 余下 部 分 。 如 果 s 由 0*1+0t+1* 生成, 并且; 以 10 开始 ， 写 
YE ;= 二 xyz， 其 中 x 二 10，y 是 下 一 个 符号 ，z Es 的 余下 部 分 。 按 这 种 方式 划分 s 可 以 证 明 它 能 
WRT. Ws 由 10* 1 生成 ， 可 以 将 其 写成 zx-yz， 其 中 xz 二 1，y 二 0,，z 是 s 的 余下 部 分 。 这 
种 划分 给 出 了 抽取 s 的 一 个 途径 。 


. 设 B= 二 {0"1"|m 关 n}。 可 以 观察 到 BN 站 0* 1* 二 {0*1*|k 宇 0}。 若 B 是 正则 的 ， 那么 B 和 B 人 0* 


1* 也 是 正则 的 。 但 是 已 知 {0*1*|k 宇 0; 不 是 正则 的 ， 因 而 B 不 是 正则 的 。 

男 一 种 选择 ， 直 接 用 有 泵 引 理 证 明 B 是 非 正 则 的 , 但 这 样 做 需要 一 定 的 技巧 。 假 设 B= 二 {0”1"| 
mn} 是 正则 的 。 令 p 为 泵 引 理 给 出 的 泵 长 度 。 可 以 观察 到 p! 不 出 现在 从 1 到 p 的 所 有 整数 
h, H p! 王妃 ( 力 一 1)( 轧 一 2)…1。 串 s=0t1?+?! CB, 并且 |s| Sp. KARI BiH s 可 以 
被 划分 为 zyz， 这 里 r=0°, y=0¢, z= 二 0:1t+tp! ,其 中 b>1 并 且 < 十 2 十 c 一 加。 设 HB 
xyz, 其 中 i 一 pl /b, WA y'=0?!, IAT yt! Oo! FEAL s —ortotet ot ata, REAA 
SSOP EB, F. 
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上 下 文 无 关 文 法 





上 一 章 介 绍 了 有 穷 自动 机 和 正则 表达 式 这 两 种 不 同 但 等 价 的 描述 语言 方法 。 虽 然 它 们 
能 描述 许多 语言 ， 但 还 有 一 些 简单 的 语言 不 能 用 它们 描述 ， 如 {0”1”|n 宇 0}。 

本 草 介绍 一 种 能 力 更 强 的 描述 语言 数学 模型 ， 上 下 文 无 关 文 法 (context-free grammar), 
它 能 够 描述 某 些 应 用 广泛 的 具有 递归 结构 特征 的 语言 。 

在 钱 究 目 然 语言 时 ， 人 们 引入 了 上 下 文 无 关 文 法 。 例 如 ， 名 词 短 语 可 以 出 现在 动词 短 
语 中 ， 反 之 ， 动 词 短语 也 可 以 出 现在 名 词 短 语 中 ， 因 此 在 名 词 、 动 词 、 介 词 以 及 它们 的 短 
语 之 间 的 关系 中 存在 着 自然 的 递归 ， 上 下 文 无 关 文 法 有 助 于 整理 并 理解 这 些 关系 。 

上 下 文 无 关 文 法 在 程序 设计 语言 的 规范 化 及 编译 中 有 重要 应 用 。 程 序 设 计 语 言 的 文法 
犹如 外 语 语法 参考 书 ， 设 计 人 员 在 编写 程序 设计 语言 的 编译 器 和 解释 器 时 ， 常 需 先 获取 该 
语言 的 文法 。 大 多 数 编 译 器 和 解释 器 都 包含 一 个 语法 分 析 器 (parser)， 它 在 生成 编译 代码 
或 解释 程序 执行 前 ， 提 取出 程序 的 语义 。 上 下 文 无 关 文法 使 得 构造 语法 分 析 器 的 工作 变 得 
容易 ， 某 些 工具 甚至 能 根据 文法 自动 地 生成 语法 分 析 器 。 

与 上 下 文 无 关 文法 相关 的 语言 集合 称 为 上 下 文 无 关 语 言 (context-free language)。 它 
包括 所 有 的 正则 语言 以 及 许多 其 他 语言 类 。 本 章 将 给 出 上 下 文 无 关 文 法 的 形式 化 定义 ， 并 
研究 上 下 文 无 关 语言 的 性 质 。 此 外 ， 还 将 介绍 识别 上 下 文 无 关 语 言 的 机 器 下 推 自 动机 
(pushdown automata) ， 它 使 我 们 能 够 进一步 地 了 解 上 下 文 无 关 文 法 的 能 力 。 


2. 1 上 下 文 无 天 文法 概述 


下 面 给 出 一 个 上 下 文 无 关 文 法 的 示例 ， 称 其 为 Gi: 
A>0A1 
A>B 
B-> # 

一 个 文法 由 一 组 替换 规则 (substitution rule) 组成， 替换 规则 又 称 为 产生 式 (pro- 
duction) 。 每 条 规则 占 一 行 ， 由 一 个 符号 和 一 个 字符 串 构 成 ， 符 号 和 字符 串 之 间 用 箭头 隔 
开 。 符 号 称 为 变 元 〈variable) ， 字 符 串 由 变 元 和 另 一 种 称 为 终结 符 (termina) 的 符号 组 
成 。 变 元 常用 大 写字 母 表 示 ， 终 结 符 类 似 于 输入 字符 ， 常 用 小 写字 母 、 数 字 或 特殊 符号 表 
示 。 一 个 变 元 被 指定 为 起 始 变 元 (start variable) ， 通 常 它 出 现在 第 一 条 规则 的 左边 。 在 上 
述 示 例 中 ， SHG 有 3 条 规则 ，A 和 B 是 变 元 ， 其 中 A 是 起 始 变 元 ，0、1 和 # 是 终 
结 符 。 

按照 以 下 方法 ， 能 够 根据 文法 生成 其 所 描述 的 语言 的 每 一 个 字符 串 。 

1. 写 下 起 始 变 元 。 它 是 第 一 条 规则 左边 的 变 元 ， 除 非 另 有 指定 。 

2. 取 一 个 已 写 下 的 变 元 ， 并 找到 以 该 变 元 开始 的 规则 ， 把 这 个 变 元 替换 成 规则 右边 
的 字符 串 。 

3. 重复 步 又 2， 直到 写 下 的 字符 串 没 有 变 元 为 止 。 
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例如 ， 文 法 G 生成 字符 串 000# 111。 获 取 一 个 字符 串 的 替换 序列 称 为 派生 (derivation). 
文法 G1 生成 字符 串 000# 111 的 派生 过 程 为 
A >0A1 300A11 >000A111 >000B111 >000#111 


可 用 语法 分 析 树 (parse tree) 更 加 形象 地 描绘 这 一 派生 过 程 。 


A 

图 2- 1 给 出 了 Gi 的 一 棵 语法 分 析 树 。 A 

用 上 述 方式 生成 的 所 有 字符 串 构成 该 文法 的 语言 (lan- 
guage of the grammar), AJL(G:) 表示 文法 G1 的 语言 ， 可 以 N 

看 出 L(G1) 二 {0"#1"|n 宇 0}。 能 够 用 上 下 文 无 关 文 法 生成 的 | 


语言 称 为 上 下 文 无 关 语言 (CFL)。 为 方便 起 见 ， 在 描述 一 个 1 
上 下 文 无 关 文法 时 ， 对 左边 变 元 相同 的 规则 采用 缩写 的 形式 ， 
比如 ，A 一 0A1 和 A 一 B 缩写 成 一 行 A~0A1|B, HH “|” 
表示 “或 ”。 
下 面 是 另 一 个 上 下 文 无 关 文 法 (G) 的 示例 ， 文 法 描述 了 一 个 英语 片断 : 
(甸子) 一 (名 词 短 语 )〈( 动 词 短 语 》 
(名 词 短 语 )>( 复 合 名 词 )| (复合 名 词 )( 介 词 短 语 ，》 
(动词 短语 )>( 复 合 动 词 )| (复合 动词 )《 介 词 短 语 ，》 
(介词 短语 ) 一 (介词 )( 复 合 名 词 》 
(复合 名 词 》_>( 冠 词 )( 名 词 》 
《复合 动词 ?> 一 (动词 ?|( 动 词 )( 名 词 短语 》 
( 74, 1] )—a| the 
(4 ia] )>—boy| girl | flower 


0 # E A 1 
图 2-1 在 文法 Gi 中 关于 
000 #111 的 语法 分 析 树 


( of 17] )>—touches| likes | sees 
《介词 ?一 with 
文法 Gs 包含 10 个 变 元 〈 写 在 尖 括 号 内 的 词汇 ) 、27 个 终结 符 ( 标 准 的 英文 字母 加 上 
空格 符 ) 和 18 条 规则 。 下 面 是 L(G;) 中 的 3 个 字符 串 : 
a boy sees 
the boy sees a flower 
a girl with a flower likes the boy 
这 些 字 符 串 都 可 以 由 文法 G 派生 出 来 ,下 面 是 第 一 个 字符 串 的 派生 : 
(句子 〉 二 (名 词 短语 〉) 《动词 短语 》X 
>( ZEA) (mid iF) 
=> (i) (At) (mi iF) 
>a (Zi) (mW AB) 
=a boy 《动词 短语 
>a boy (4 4m i) 
=a boy (iq) 
=a boy sees 


2.1.1 上 下 文 无 关 文法 的 形式 化 定义 
下 面 将 上 下 文 无 关 文法 (CFG) 的 概念 形式 化 。 
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1l.V 是 一 个 有 穷 集 合 
字符 串 构成 。 


上 下 文 无 关 文 法 (context-free grammar) 是 一 个 4 元 组 (V,5,R,S), E 
称 为 变 元 集 (variables), 
4. SEV 是 起 始 变 元 。 


2. 上 是 一 个 与 V 不 相交 的 有 穷 集合 ， 称 为 终结 符 集 (terminals), 


3. 尺 是 一 个 有 穷 规则 集 (rules) ， 每 条 规则 由 一 个 变 元 和 一 个 由 变 元 及 终结 符 组 成 的 


wu, v Aw 是 由 变 元 及 终结 符 构 成 的 字符 串 ，A 一 w 是 文法 的 一 条 规则 ， 称 uAv E 
X (yield) uwv, WE uAva>uwv, WER u=v, RAGES ui ,us,，… sue, (EE 
u uI Uy FUE =U 
其 中 & 宇 0， 则 称 派生 (derive)v， 记 作 二 v。 该 文法 的 语言 是 (wed* |S >w). 
在 文法 G1 中 , V={A,B}, S=(0,1,4#}, S 二 A,R 是 上 面 提 到 的 示例 中 给 出 的 3 条 规 
则 。 在 文法 Gz 中 ， 
V= (AF), (4M), (MBA), 
(ih BiB), (REAM), 《复合 动词 〉， 
(7h I>, (AT), (mi), (Fp iay} 
AII o 


Z= {a b,c", Z,“ ar 符号 oe 表示 空白 ， 它 放 在 每 个 单词 as boy 等 的 后 面 ， 将 单词 


在 描述 一 个 文法 时 ， 通 稍 只 写 出 它 的 规则 。 出 现在 规则 左边 的 所 有 符号 都 是 变 元 ， 其 
余 的 符号 都 是 终结 符 ， 按 照 惯例 ， 起 始 变 元 是 第 一 条 规则 左边 的 变 元 。 
2.12 上 下 文 无 大 文法 举例 

例 2.2 


S—aSb|SS|e 


考虑 文法 G= CUS}, {a bpd. SY, 其 中 规则 集 RR 为: 

该 文法 生成 abab，aaabbb ，aababb 等 字符 串 。 如 果 把 a 看 作 左 插 号 “〈(”， 把 b 看 作 右 括 
号 “)”， 可 以 看 出 L(Gs) FAEK RENES FERIRA 
是 空 串 e。 


TORYY, A= tae dy 规则 RW: 


注意 规则 右 部 可 能 


i@ 
(EXPR)—(EXPR)+<(TFRM) | (TERM) 


PEASE Gy =(V,5,R,(EXPR)), JEt V={(EXPR), (TERM), (FAC- 
(TERM)->(TERM) X (FACTOR) | (FACTOR) 
(FACTOR)—((EXPR)) |a 
文法 G4 可 以 生成 字符 串 a 十 aXa 和 (a 十 a) Xa。 它 们 的 语法 分 析 树 在 图 2-2 中 给 出 。 
编译 程序 把 用 程序 设计 语言 编写 的 代码 翻译 成 男 一 种 更 适合 机 器 执行 的 代码 。 编 译 程 
序 提取 被 编译 代码 的 语义 ， 这 一 过 程 称 为 语法 分 析 (parsing)。 在 关于 该 程序 设计 语言 
上 下 文 无 关 文 法 中 ， 编 译 代 码 的 意思 可 以 用 代码 的 语法 分 析 树 进行 表达 。 上 下 文 无 关 语 言 
的 算法 将 在 后 面 的 定理 7.14 和 问题 7. 22 中 讨论 分 析 。 
文法 G4 描述 程序 设计 语言 中 涉及 算术 表达 式 的 一 个 片断 。 观 察 图 2- 2 中 的 语法 分 析 


树 如 何 对 运算 进行 “分 组 ”。 关 于 a 十 aXa 的 语法 分 析 树 把 运算 符 X 连 同 它 的 运算 对 象 
(后 2 个 a)〉 作 为 运算 符 十 的 一 个 运算 对 象 ， 而 在 关于 (a 十 a) Xa 的 语法 分 析 树 中 ， 分 组 方 
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(EXPR) 
\ 
(TERM) 
< 
(TERM) 
i (FACTOR) 


RM) 





— x ct = t a +} xg 


Al 2-2 关于 字符 串 a 十 aXa 和 (ata) Xa 的 语法 分 析 树 


式 正好 相反 。 这 种 分 组 方式 符合 标准 的 乘法 优先 于 加 法 和 用 括号 打破 这 种 优先 的 规定 ， 文 
法 G4 的 设计 体现 了 这 种 优先 关系 。 a 


2.1.3 设 订 上 下 文 无 大 文法 


与 在 1. 1 市 中 讨论 有 穷 目 动机 的 设计 一 样 ， 设 计 上 下 文 无 关 文 法 需要 创造 力 。 因 为 读 
者 更 习惯 为 指定 的 任务 给 一 台 机 器 编程 ， 而 不 是 用 文法 去 描述 语言 ， 所 以 设计 上 下 文 无 关 
文法 比 设计 有 穷 自动 机 更 加 藉 手 。 当 你 面 对 构 造 一 个 CFG 的 问题 时 ， 可 以 单独 使 用 或 混 
合 使 用 下 述 技巧 。 
首先 ， 化 繁 为 简 。 解 决 几 个 较 人 简单 的 问题 常常 比 解决 一 个 复杂 的 问题 容易 ， 许 多 CFL 
是 由 几 个 较 简 单 的 CFL 合并 成 的 。 如 果 你 要 为 一 个 CFL 构造 CFG， 而 这 个 CFL 可 以 分 
成 几 个 较 简 单 的 部 分 ， 那么 就 把 它 分 成 几 部 分 ， 并 且 分 别 构 造 每 一 部 分 的 文法 。 这 几 个 文 
法 能 够 很 容易 地 合并 在 一 起 ， 构 造 出 原先 那个 语言 的 文法 ， 我 们 需要 做 的 只 是 把 它们 的 规 
则 都 放 在 一 起 ， 再 加 入 新 的 规则 SS) |S 1…|S:， 其 中 Si,Sz,…,Se 是 各 个 文法 的 起 始 
变 元 。 
例如 ， 为 得 到 语言 (01 |n>0} U {170 |n>0) 的 文法 ， 先 构造 语言 {0"1"|n>0} 
的 文法 
Si 0S; lle 
和 语言 {1"0" | ”之 0} 的 文法 
Sz 一 1Sz0|s 
然后 加 上 规则 SS, |S* ， 得 到 所 求 的 文法 : 
S— Sı | S: 
Si>0S;1 le 
S2> 1620 le 
其 次 ， 利 用 正则 。 如 果 一 个 语言 碰巧 是 正则 的 ， 可 先 构 造 它 的 DFA， 再 构造 它 的 
CFG 就 容易 了 。 通 过 下 述 方法 可 以 把 任何 一 台 DFA 转换 成 等 价 的 CFG: 对 于 DFA 的 每 
一 个 状态 9; ， 指 定 一 个 变 元 Ri. MAR lq a) =q, Æ DFA 中 的 一 个 转移 ， 则 把 规则 Ri> 
aR; 加 入 CFG; WR q; 是 DFA 的 接受 状态 ， 则 把 规则 Rime MA CFG。 设 ao Æ DFA 的 
起 始 状态 ， 则 取 Ro 作为 CFG 的 起 始 变 元 。 可 以 验证 所 得 到 的 CFG 生成 的 语言 与 DFA 识 
别 的 语言 相同 。 
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再 次 ， 考 察 子 串 。 某 些 上 下 文 无 关 语 言 中 的 字符 串 有 两 个 “相互 联系 ”的 子 串 ， 为 了 
检查 这 两 个 子 串 中 的 一 个 是 否 正好 对 应 于 另 一 个 ， 识 别 这 种 语言 的 机 器 需要 记 住 其 中 一 个 
子 串 的 信息 ， 而 这 个 信息 是 无 界 的 。 例 如 ， 在 语言 (0"l"|n>0} 中 就 出 现 这 种 情况 ， 为 
了 检查 字符 串 中 0 的 个 数 是 否 等 于 1 ATR. Blake RICE 0 的 个 数 。 对 于 这 种 情况 ， 可 
以 使 用 ReuRv 形式 的 规则 ， 它 产生 的 字符 串 中 包含 的 部 分 对 应 包含 v 的 部 分 。 

最 后 ， 利 用 递归 。 在 更 复杂 的 语言 中 ， 字 符 串 可 能 包含 一 定 的 结构 ， 而 这 种 结构 又 递 
归 地 作为 为 一 种 (或 者 同一 种 ) 结构 的 一 部 分 出 现 。 例 2. 3 生成 算术 表达 式 的 文法 中 就 有 
这 种 情况 ， 每 次 出 现 符号 a， 就 会 递归 地 出 现 一 个 用 括号 括 起 来 的 完整 的 算术 表达 式 来 蔡 
换 。 为 了 得 到 这 样 的 结果 ， 把 生成 这 种 结构 的 变 元 放 在 规则 中 这 种 结构 对 应 可 能 出 现 递 归 
的 地 方 。 


2.1.4 歧义 性 


有 时 在 一 个 文法 中 能 够 用 几 种 不 同 的 方式 产生 出 同一 个 字符 串 ， 这 样 的 字符 串 有 几 棵 
不 同 的 语法 分 析 树 ， 对 应 几 个 不 同 的 含义 。 这 样 的 结果 对 于 某 些 应 用 可 能 是 不 希望 见 到 
的 ， 例 如 ， 对 于 程序 设计 语言 ， 一 个 程序 应 该 具有 唯一 的 解释 。 
如 果 文 法 以 不 同 的 方式 产生 同一 个 字符 串 ， 则 称 文法 歧义 地 产生 这 个 字符 串 。 如 果 一 
个 文法 歧义 地 产生 某 个 字符 串 ， 则 称 这 个 文法 是 歧义 的 。 例 如 ， 对 于 文法 Gs: 
(EXPR)—> (EXPR)+ (EXPR) | (EXPR) X (EXPR) | ((EXPR))|a 
这 个 文法 歧义 地 产生 字符 串 a 十 aXa。 图 2- 3 给 出 它 的 两 棵 不 同 的 语法 分 析 树 。 


(EXPR) (EXPR) 
a w / 
(EXPR) (EXPR) (EXPR) (EXPR) 
rE IAN 
(EXPR) | (EXPR) (EXPR) |(EXPR) 
| ` / \ 
a + a X a a + a x a 


图 2-3 字符 串 a 十 aXa 在 文法 Gs 中 的 两 棵 语法 分 析 树 


这 个 文法 没有 把 握 住 通常 的 优先 级 关系 ， 可 能 把 十 放 在 了 多 的 前 面 ， 也 可 能 反 过 来 
把 XxX 放 在 了 十 的 前 面 。 而 前 面 提 到 的 文法 G4 能 产生 相同 的 语言 ， 但 其 产生 的 每 一 个 字符 
串 只 有 一 棵 唯一 的 语法 分 析 树 。 因 此 ，G4 是 非 歧义 的 ， 而 Gs 是 歧义 的 。 

本 节 开 始 部 分 给 出 的 文法 Go 是 歧义 文法 的 男 一 个 例子 。 句 子 “the girl touches the 
boy with the flower” 有 两 个 不 同 的 派生 。 在 练习 2.8 中 要 求 给 出 它 的 两 棵 语法 分 析 树 ， 
并 且 观 察 用 这 两 种 方式 读 这 个 句子 时 其 表达 的 含义 之 间 的 关系 。 

现在 把 习 义 性 的 概念 形式 化 ， 一 个 文法 疏 义 地 产生 一 个 字符 串 的 意思 是 指 : RA 
有 两 棵 不 同 的 语法 分 析 树 ， 而 不 是 两 种 不 同 的 派生 ， 两 种 不 同 的 派生 可 能 仅仅 是 替换 变 元 
的 次 序 不 同 ， 而 不 是 整个 结构 的 不 同 。 为 了 专注 于 结构 ， 定 义 一 种 以 固定 次 序 替 换 变 元 的 
派生 类 型 ， 对 于 文法 G 中 的 一 个 字符 串 w 的 派生 ， 如 果 在 每 一 步 都 是 替换 最 左边 剩 下 的 
变 元 ， 则 称 这 个 派生 是 最 左派 生 (leftmost derivation) 。 在 前 面 定 义 2.1 中 给 出 的 派生 是 
一 个 最 左派 生 。 

如 果 字 符 串 由 在 上 下 文 无 关 文法 G 中 有 两 个 或 两 个 以 上 不 同 的 最 左派 
生 ， 则 称 G 歧义 地 (ambiguously) EFH E 包 ， 如 果 文 法 G 歧 义 地 产生 某 个 字符 串 ， 
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则 称 G 是 歧义 的 (ambiguous), 

有 时 对 于 一 个 歧义 文法 能 够 找到 一 个 产生 相同 语言 的 非 歧 义 文法 。 但 是 ， 某 些 上 下 文 
无 关 语 言 只 能 用 皮 义 文法 产生 ， 称 这 样 的 语言 为 固有 歧义 的 (inherently ambiguous). [A] 
题 2. 41 要 求证 明 语 言 {aibict|i==j 或 7 一 A) 是 固有 歧义 的 。 


2.1.5 Free ese st 


在 使 用 上 下 文 无 关 文 法 时 ， 简 化 的 形式 往往 更 为 方便 ， 一 种 最 简单 、 最 有 用 的 形式 称 
为 乔 姆 斯 基 范 式 。 在 第 4 草 和 第 7 章 中 ， 当 设计 使 用 上 下 文 无 关 文 法 的 算法 时 ， 将 会 发 现 
乔 姆 斯 基 范 式 的 用 途 。 

称 一 个 上 下 文 无 关 文 法 为 乔 姆 斯 基 范 式 (Chomsky normal form), wR 
它 的 每 一 个 规则 具有 如 下 形式 : 

ABC 

A—>a 
HP, a 是 任意 的 终结 符 ，A、B 和 C 是 任意 的 变 元 ,， 且 BB 和 C 不 能 是 起 始 变 元 。 此 外， 
允许 规则 Sree, HPS 是 起 始 变 元 。 

任 一 上 下 文 无 关 语言 都 可 以 用 一 个 乔 姆 斯 基 范 式 的 上 下 文 无 关 文 法 产生 。 

证 明 思 路 可 以 将 任 一 上 下 文 无 关 文 法 G 转换 成 乔 姆 斯 基 范 式 ， 转 换 时 分 几 个 阶段 把 
不 符合 要 求 的 规则 替换 成 等 价 的 符合 要 求 的 规则 。 首 先 ， 添 加 一 个 新 的 起 始 变 元， 然后 ， 
删除 所 有 形 如 A~>s 的 e 规则 ， 再 删除 所 有 形 如 A 一 B 的 单一 规则 。 在 删除 时 ， 要 对 文法 
做 适当 的 弥补 ， 以 确保 仍然 产生 相同 的 语言 。 最 后 ， 把 所 有 留 下 来 的 规则 转换 成 适当 的 
形式 。 

证 明 首先 ， 添 加 一 个 新 的 起 始 变 元 So 和 规则 SSS, RPS 是 原来 的 起 始 变 元 。 
这 样 可 以 保证 起 始 变 元 不 出 现在 规则 的 右边 。 

第 二 阶段 ， 考 虑 所 有 的 es 规则。 删除 一 条 es 规则 A 一 e， 这 里 A 不 是 起 始 变 元 ， 然 后 对 
在 规则 右边 出 现 的 每 一 个 A， 删 去 这 个 A 后 得 到 一 条 新 的 规则 。 换 言 之 ， 如 果 R>uAv È 
一 条 规则 ， 其 中 x 和 w 是 变 元 和 终结 符 的 字符 串 ， 则 添加 规则 Ruvu, X A 的 每 一 次 出 现 
都 如 此 进行 ， 因 而 对 于 规则 ReuAvAw, BY R-uvAw, R-uAvw Fl R —>uvw., WR 
有 规则 R 一 A， 则 要 添加 Re， 除 非 前 面 已 经 删除 过 规则 R>e。 重 复 进行 上 述 步骤 ， 直 至 
删除 所 有 不 包括 起 始 变 元 的 s 规则 。 

第 三 阶段 ， 处 理 所 有 的 单一 规则 。 删 除 一 条 单一 规则 A 一 B， 然 后 ， 只 要 有 一 条 规则 
B>u， 就 要 添加 规则 A 一 w， 除 非 A—>u 是 已 在 前 面 被 删除 的 单一 规则 。 和 前 面 一 样 ，u 是 
变 元 和 终结 符 的 字符 串 。 重 复 上 述 步 又， 直至 删除 所 有 的 单一 规则 。 

最 后 ， 把 所 有 留 下 的 规则 转换 成 适当 的 形式 。 把 每 一 条 规则 Auu ur 蔡 换 成 规则 
AuA;, Ai—uzAz2, Az—-u3A35 +5 Ar—2—>ur—iur 其 中 人 之 3， 每 一 个 妈 是 一 个 变 元 或 终 
watt, Ai 是 新 的 变 元 。 用 新 变 元 U; 替换 上 面 规则 中 的 终结 符 u;， 并 增加 规则 Uiui 。 x 

设 Ge 是 下 述 CRFG， 用 刚才 给 出 的 转换 过 程 把 它 转换 成 乔 姆 斯 基 范式 。 下 面 
用 一 系列 文法 规则 说 明 转 换 的 步骤 ， 其 中 用 黑体 写 的 规则 是 新 添加 进来 的 规则 ， 用 带 阴 影 
的 字 写 的 规则 是 刚刚 删 掉 的 规则 。 

1. 原先 的 CFG Cs 在 左边 给 出 。 运 用 第 一 步 引 入 新 起 始 变 元 后 得 到 的 结果 在 右边 显示 。 
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So 一 人 

S—~ASA|aB S—ASA|aB 
A>B|S A—>B|S 
B~>ble B—>ble 

2. 左边 给 出 删除 e 规则 Be 后 的 结果 ， 右 边 给 出 删除 Ae 后 的 结果 。 
So 一 9 So==S 
S~ASA|aB|a S~ASA|aB|a|SA|AS|S 
A—B|Sle A—B|S\l¢ 
B—ble B—b 

3a. 左边 给 出 删除 单一 规则 SSS 后 的 结果 ， 右 边 给 出 删除 So 一 S 后 的 结果 。 
SoS SoS |ASA|aBla|SA|AS 
S~ASA|aB|a|SA|AS|S S—ASA|aBla|SA|AS 
A—>B|S ABIS 
B—>b B—>b 

3b. 删除 单一 规则 A 一 B AAS, 
So—>ASA|aB|a| SA|AS So 一 ASA|aBljalSA|AS 
S~ASA|aB|a|SA|AS S~ASA|aB|a|SA|AS 
A—>B|S|b A—>S|b|ASA|aB|a|SA|AS 
B—>b B—b 


4. 添加 新 的 变 元 和 规则 ， 把 留 下 的 所 有 规则 转换 成 合适 的 形式 。 最 后 得 到 的 符合 乔 
姆 斯 基 范 式 的 文法 等 价 于 Ge 。 (按照 定理 2.6 证明 中 的 转换 过 程 ， 应 把 So 一 ASA 替换 成 
So 一 AAl! Fl Ai >SA; 把 S 一 ASA 替换 成 S 一 AA, 和 A; 一 SA; 把 A 一 ASA 替换 成 A 一 
AA; 和 As 一 SA。 其 中 Al ，As 和 As 是 新 引入 的 变 元 ， 这 里 作 了 化 简 , WEA, A: 和 As 
合并 成 一 个 变 元 并 将 这 些 规则 以 Ua 表示 。 一 一 译 者 注 ) 

So—> AA, | UB |a| SA | AS 

S— AA; | UB |a| SA | AS 

A—> b | AA; | UB |a| SA | AS 

Aı—> SA 

U—a 

B—> b n 


2.2 下 推 自动 机 


本 节 介 绍 一 种 称 为 下 推 自 动机 (pushdown automata) 的 计算 模型 ， 它 很 像 非 确定 型 
有 穷 目 动机 ， 但 是 它 有 一 个 称 为 栈 (stack) 的 额外 设备 。 栈 在 控制 部 的 有 限 存 储量 之 外 提 
供 了 附加 的 存储 ， 使 得 下 推 目 动机 能 够 识别 某 些 非 正则 语言 。 

下 推 目 动机 在 能 力 上 与 上 下 文 无 关 文 法 等 价 。 因 此 ， 在 证 明 一 个 语言 是 上 下 文 无 关 的 
时 候 ， 有 两 种 选择 : 可 以 给 出 生成 它 的 上 下 文 无 关 文 法 ， 或 者 给 出 识别 它 的 下 推 目 动机 。 
某 些 语言 用 文法 生成 能 描述 要 容易 些 ， 男 一 些 用 自动 机 识别 占 描 述 更 容易 。 

图 2-4 是 一 侣 有 穷 目 动机 的 示意 图 ， 控 制 大 表示 状态 和 转移 图 数 ， 带 子 存 放 输入 字符 
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串 ， 箭 头 表 示 输 入 头 位 置 ， 它 指 回 下 一 个 要 读 的 输入 符号 。 
如 果 在 此 基础 上 加 一 个 栈 ， 我们 得 到 一 台 下 推 自 动机 的 示意 图 ， 如 图 2- 5 所 示 。 





状态 
a ws 


图 2-4 一 台 有 穷 自动 机 的 示意 图 图 2-5 一 台 下 推 自动 机 的 示意 图 


下 推 自动 机 (PDA) 能够 把 符号 写 到 栈 上 并 在 随后 读 取 它 ， 向 栈 中 写 入 一 个 符号 将 把 
栈 中 其 他 的 所 有 符号 “下 推 ?。 在 任何 时 刻 ， 可 以 读 和 删 去 栈 顶 的 符号 ， 其 余 的 符号 向 上 
移动 。 向 栈 写 一 个 符号 ， 常 常 称 为 推 入 〈pushing) 这 个 符号 ， 而 删除 一 个 符号 称 为 弹出 
(popping) 它 。 需 要 注意 的 是 ， 对 栈 的 所 有 访问 ， 无 论 读 写 ， 都 只 能 在 栈 顶 进行 ， 换 言 
之 ， 栈 是 一 个 “先进 后 出 ”的 存储 设备 。 如 果 把 某 个 信息 写 到 栈 上 ， 然 后 又 把 另外 一 些 信 
息 写 到 栈 上 ， 那 么 前 面 写 的 信息 变 成 不 可 访问 的 ， 一 直到 在 其 后 面 写 人 的 信息 全 部 被 删除 
为 止 。 

可 以 用 自助 餐厅 服务 台 上 的 盘子 来 解释 栈 ， 一 到 盘子 放 在 弹 得 上 ， 把 一 个 新 盘子 放 在 
这 和 肢 盘 子 的 项 上 时 ， 它 下 面 的 盘子 依次 向 下 移动 ， 下 推 自 动机 的 栈 就 像 一 琶 盘 子 ， 每 个 盘 
子 上 与 看 一 个 符号 。 

栈 的 作用 体现 在 它 能 保存 无 限 的 信息 量 。 有 穷 自动 机 (DFA) 不 能 用 它 的 有 限 存 储 保 
存 大 数据 量 的 字符 串 ， 所 以 它 不 能 识别 语言 (071"|n>0}, m PDA 可 以 用 栈 保存 它 看 见 
的 0 的 个 数 ， 从 而 能 够 识别 这 个 语言 ， 因 此 ， 栈 的 无 界 性 使 得 PDA 能 够 保存 大 小 没有 限 
制 的 数 。 下 面 非 形 式 化 地 描述 关于 语言 {0"1"|n>0} 的 PDA 如 何 工 作 : 

读 取 输入 串 的 符号 ， 每 读 一 个 0， 把 它 推 入 栈 ， 一 旦 看 见 1 之 后 ， 每 读 一 个 1， 把 一 
个 0 弹出 栈 ， 当 栈 中 的 0 被 清空 时 恰好 读 完 输入 串 ， 则 接受 这 个 输入 。 如 果 在 还 有 1 没有 
读 的 时 候 栈 已 变 空 ， 或 者 在 栈 中 还 有 0 的 时 候 1 已 经 读 完了 ; 或 者 0 出 现在 1 的 后 面 ， 则 
拒绝 这 个 输入 。 

下 推 自 动机 可 以 是 非 确定 型 的 ， 确 定型 下 推 自 动机 与 非 确定 型 下 推 自 动机 在 语言 识别 
能 力 上 不 相同 。 在 2. 4 节 ， 我们 将 看 到 一 些 非 确定 型 下 推 自动 机 能 识别 但 确定 型 下 推 自 动 
机 不 能 识别 的 语言 。 我 们 将 在 例 2. 10 和 例 2.11 给 出 需要 非 确 定型 自动 机 才能 识别 的 语 
言 。 确 定型 有 穷 自动 机 与 非 确 定型 有 穷 自动 机 能 识别 相同 的 语言 ， 但 对 于 下 推 自动 机 却 有 
区 别 。 由 于 非 确定 型 下 推 自 动机 等 价 于 上 下 文 无 关 文 法 ， 所 以 我 们 集中 讨论 非 确定 型 下 推 
自动 机 。 


2.2.1 下 推 自动 机 的 形式 化 定义 


除 栈 之 外 ， 下 推 自动 机 的 形式 化 定义 类 似 于 有 穷 自 动机 。 栈 是 一 个 存放 符号 的 设备 ， 
这 些 符号 取 自 某 个 字母 表 。 机 器 对 于 它 的 输入 和 栈 ， 可 以 使 用 不 同 的 字母 表 ， 因 此 需要 同 
时 指定 一 个 输入 字母 表 三 和 一 个 栈 字 母 表 卫 。 

任何 自动 机 的 形式 化 定义 的 核心 都 是 转移 函数 ， 因 为 要 用 它 描 述 目 动机 的 动作 。 给 定 
3. 一 5U{e}, =TUle), RB RAH ELBA XE X.. FH, ESWAS F, F- 
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个 读 到 的 输入 符号 和 栈 顶 的 符号 决定 了 下 推 自 动机 的 下 一 个 动作 。 这 两 个 符号 都 可 以 是 e, 
使 机 如 能 够 在 不 读 输入 符号 或 者 不 读 栈 中 符号 的 情况 下 做 动作 。 

关于 转移 函数 的 值 域 ， 需 要 考虑 在 特定 情形 下 人 允许 自动 机 做 什么 。 它 能 够 进入 某 个 新 
的 状态 并 可 能 在 栈 顶 写 和 一 个 符号 。 通 过 返回 Q 的 一 个 成 员 和 3。 的 一 个 成 员 ， 即 XT 
HARR, KA o 可 以 指出 这 个 动作 。 由 于 在 这 个 模型 中 允许 非 确 定性 ， 所 以 可 能 有 若 
二 个 合法 的 下 一 个 动作 ， 转 移 函 数 通 过 返回 QXT 的 一 个 子 集 ， 即 PC(QXT.)〉 的 一 个 成 员 
来 体现 转移 动作 的 非 确 定性 。 所 有 这 些 子 集合 并 在 一 起 ， 得 到 转移 孔 数 6 的 形式 为 6: 
Cl eT 

下 推 自动 机 (pushdown automaton) 是 6 元 组 (Q,5,7,6.q,,F), & 2 
Q.2. AF 都 是 有 穷 集合 ， 并 且 

1.Q 是 状态 集 。 

2.5 RMAF HR. 

3. 卫 是 栈 字母 表 。 

4. :QX E: XI. > P(QXT。) 是 转移 函数 。 

5. gg EQ 是 起 始 状 态 。 

6. FCQ 是 接受 状态 集 。 

一 台 下 推 自动 机 M=(Q,5,7.6.q,.F) 的 计算 过 程 如 下 : 它 接受 输入 w， 如 果 能 够 
把 w 写成 ww 二 wiw2…wm， 这 里 每 一 个 w; E53， 并 且 存 在 状态 序列 ro ,ri,…,rmEQ 和 
字符 串 序列 so 551 ，… ,sm ET* 满足 下 述 3 个 条 件 : 

l. ro 二 qo H soe, KARA M 从 起 始 状 态 和 空 栈 开始 。 

2. 对 于 i=0,-°,m—1, 有 Critisb) Elri witi sa), JEP smat, s+ = bta bET, 
和 tET*。 该 条 件 说 明 M 在 每 一 步 都 完全 按照 当时 的 状态 、 栈 顶 符号 和 下 一 个 输入 符号 
动作 。 

3. mm EF， 该 条 件 说 明 在 输入 结束 时 出 现 一 个 接受 状态 。 
则 字符 串 s 是 M 在 计算 的 接受 分 支 中 的 栈 内 容 序 列 。 


2.2.2 下 推 自 动机 举例 


下 面 是 前 面 描述 的 识别 语言 (071"|n>0} 的 PDA 的 形式 化 定义 。 令 Mi = 
(Q,2>,T ,06,9g) of), 其 中 


Q= 14) >02 ,93 994} 
y={0,1} 
r={0,$ } 
F=(q, +443 


OH PRA, RPSAW RAO. 










as 一 
eer rar 
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也 可 以 用 状态 图 描述 PDA， 如 图 2-6 和 图 2-7、 图 2-8 所 示 。 这 种 图 类 似 于 描述 有 穷 
自动 机 的 状态 图 ， 但 要 做 一 些 修改 ,使 得 它 能 说 明 PDA 在 从 一 个 状态 转移 到 另 一 个 状态 
时 如 何 使 用 栈 。 用 “<，2%->c” 表 示 当 机 器 从 输入 中 读 到 a 时 
可 以 用 c 替换 栈 顶 的 符号 5。a、b 和 cc 中 的 任何 一 个 都 可 以 是 
e 。 如 果 a 是 e， 则 机 器 做 这 个 转移 ， 而 不 读 取 输入 中 的 任何 符 
号 。 如 果 是 es， 则 机 器 做 这 个 转移 ， 而 不 读 栈 中 的 任何 符号 ， 
也 不 从 栈 中 弹出 任何 符号 。 如 果 c 是 <。<， 则 机 器 做 这 个 转移 ， 
而 不 在 栈 中 写 任 何 符号 。 = 

PDA 的 形式 化 定义 没有 提供 检验 空 栈 的 直接 手段 。 这 台 2-6 识别 {0"1” |n>0) 
PDA 一 开始 把 一 个 特殊 符号 $ 放 人 栈 中 ， 就 能 够 起 到 检验 空 HY PDA My 的 状态 图 
栈 的 作用 ， 当 机 器 再 次 看 见 $ 时 ， 就 知道 栈 实 际 上 已 经 空 了 。 今 后 ， 在 PDA 的 非 形式 化 
描述 中 用 这 种 方法 判断 空 栈 。 

类 似 地 ，PDA 不 能 直接 检验 是 否 到 达 输 入 的 未 端 ， 对 于 这 台 PDA， 只 有 当 它 位 于 输 
入 的 未 端 时 ， 接 受 状态 才 起 作用 ， 这 就 能 够 起 到 同样 的 效果 。 于 是 ， 从 现在 起 ， 假 设 
PDA 能 够 检验 是 否 到 达 输 入 的 末端 ， 并 且 可 以 用 这 种 方式 实现 。 

CAD 这 个 例子 给 出 一 台 识 别 下 述 语言 的 PDA M: 

{aibict|i,7,k 宇 0 H 1 二 7 Ri=k} 

非 形 式 化 地 表示 ， 识 别 该 语言 的 PDA 先 读 a， 并 且 把 a 推 信 栈 。 当 读 完 a 时 ， 机 器 把 它们 
全 部 放 到 栈 中 ， 以 便 能 够 把 它们 与 b 或 c 进行 匹配 。 由 于 机 器 不 知道 下 面 a 是 与 b 匹配 还 
是 与 < 匹 配 ， 需 要 想 点 办 法 ， 在 这 里 迟早 要 用 到 非 确定 性 。 

利用 非 确定 性 ， 这 台 PDA 可 以 猜想 a 是 与 b 匹配 还 是 与 匹配， 如 图 2-7 所 示 。 设 
想 机 器 有 两 个 非 确定 性 的 分 支 ， 每 一 种 可 能 的 猜想 是 一 个 分 支 。 如 果 有 一 个 匹配 成 功 ， 则 
对 应 的 分 支 接受 ， 从 而 整个 机 器 接受 。 问 题 2. 27 要 求证 明 非 确定 性 是 用 PDA 识别 这 个 语 
言 所 不 可 缺少 的 。 








a, Ea b, EE C,a—é 


图 2-7 PDA M: 的 状态 图 ，M 识别 (a'bict |i j k>0, H i=j Mi=k} m 


GPRD 给 出 一 台 识别 语言 (ww? |we{0,1}*} 的 PDA Ms 。 注 意 wR 表 示 倒 写 的 
w。 这 台 PDA 的 非 形式 化 描述 和 状态 图 如 下 : 

开始 时 ， 把 读 到 的 符号 推 人 栈 中 ， 在 每 一 步 非 确定 性 地 猜想 已 经 到 达 字 符 串 的 中 点 ， 
然后 变 成 把 读 到 的 每 一 个 符号 弹出 栈 ， 检 查 在 输入 中 和 在 栈 顶 读 到 的 符号 是 否 一 样 。 如 果 
它们 总 是 一 样 的 ， 并 且 当 输入 结束 时 栈 同 时 被 清空 ， 则 接受 ; 否则 拒绝 。 
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这 台 机 更 的 状态 图 如 图 2- 8 Ara. 
问题 2. 28 证 明 识 别 这 个 语言 需要 一 台 非 确定 型 PDA, 


2.2.3 与 上 下 文 无 关 文 法 的 等 价 性 


本 节 证 明 上 下 文 无 关 文 法 与 下 推 上 自动 机 在 能 力 上 是 等 
价 的 ， 它 们 都 能 够 描述 上 下 文 无 关 语 言 类 。 下 面 要 说 明 如 
何 把 任意 一 个 上 下 文 无 关 文 法 转换 成 能 识别 相同 语言 的 下 
推 目 动机 ， 以 及 反 过 来 把 任意 一 台 下 推 自 动机 转换 成 产生 
相同 语言 的 上 下 文 无 关 文 法 。 由 前 面 的 定义 可 知 上 下 文 无 ”图 2-8 PDA Ms MRE. Ms 
关 语 言 是 能 用 上 下 文 无 关 文法 描述 的 语言 ， 因 此 本 节 的 目 PA fww lwe {0,1}*) 

标 是 证 明 下 述 定理 。 

SED 一 个 语言 是 上 下 文 无 关 的 ， 当 且 仅 当 存 在 一 台 下 推 自动 机 识别 它 。 

和 通常 对 待 “ 当 且 仅 当 ”型 定理 一 样 ， 有 两 个 方向 要 证 明 ， 在 本 定理 中 ， 这 两 个 方向 
都 是 很 有 意思 的 ， 首 先 证 明 比 较 容 易 的 从 左 到 右 的 方向 。 

个 上 网罗 如果 一 个 语言 是 上 下 文 无 关 的 ， 则 存在 一 台 下 推 自动 机 识别 它 。 

证 明 思 路 设 A 是 一 个 CFL， 根 据 定 义 ， 存 在 一 个 CFG G 产生 它 。 我 们 要 说 明 如 何 
把 G 转换 成 一 台 等 价 的 PDA P, 

通过 确定 是 否 存 在 关于 输入 w 的 派生 ， 当 G 产生 w 时 ，PDA P 接受 这 个 输入 。 记 得 
派生 就 是 当 文 法 产生 一 个 字符 串 时 所 做 的 替换 序列 ， 派 生 的 每 一 步 产生 一 个 变 元 和 终结 符 
的 中 间 字 符 串 (intermediate string), Kit P， 以 确定 是 否 有 一 系列 使 用 G 的 规则 替换 ， 
能 够 从 起 始 变 元 导出 w. 

检验 是 否 有 关于 w 的 派生 的 困难 在 于 判断 要 做 的 替换 ，PDA 的 非 确定 性 使 得 它 能 够 
猜想 出 正确 的 替换 序列 ， 在 派生 的 每 一 步 ， 非 确定 地 选择 关于 某 个 变 元 的 一 条 规则 ， 并 且 
对 这 个 变 元 做 替换 。 

PDA P 开始 时 把 起 始 变 元 写 和 人 它 的 栈 ， 一 个 接 一 个 地 做 替换 ， 经 过 一 系列 的 中 间 字 
从 串 ， 最 终 它 可 能 到 达 一 个 仅 含 有 终结 符 的 字符 串 ， 这 表示 它 用 文法 G 派生 出 一 个 字符 
串 。 如 果 这 个 字符 串 与 它 接 收 到 的 输入 相同 ， 则 P 接受 它 。 

在 PDA 上 实现 上 述 策略 还 需要 再 想 点 办 法 ， 需 要 知道 当 PDA 一 步 一 步 地 进行 时 ， 它 
如 何 存 储 中 间 字 符 串 。 直 接 使 用 栈 存储 每 一 个 中 间 字 符 串 是 一 个 诱 人 的 想法 ， 但是， 这 个 
想法 是 行 不 通 的 ， 因 为 PDA 必须 找到 在 字符 串 中 的 变 元 并 且 对 它 作 替换 ,但 PDA 只 能 够 
访问 栈 顶 符号 ， 它 可 能 是 一 个 终结 符 ， 而 不 是 变 元 。 解 决 这 个 问题 的 方法 是 在 栈 中 只 保存 
中 间 字 符 串 的 一 部 分 : 中 间 字 符 串 中 从 第 一 个 变 元 开始 的 所 有 符号 。 第 一 个 变 元 前 面 的 终 
结 符 都 恰好 与 输入 串 中 的 符号 匹配 。 图 2- 9 给 出 Teen 
PDA P, = 

P 的 非 形式 描述 如 下 : 

1. 把 标记 符 $ 和 起 始 变 元 放 人 栈 中 。 

2. 重复 下 述 步骤 : 

a. 如 果 栈 顶 是 变 元 A， 则 非 确 定 地 选择 一 个 关于 图 2-9 PP 表示 中 间 字 符 串 

A 的 规则 ， 并 且 把 A 替换 成 这 条 规则 右边 的 01A1A0 的 方式 
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字符 串 。 

b. 如 果 栈 顶 是 终结 符 a， 则 读 取 下 一 个 输入 符号 ， 并 且 把 它 与 a 进行 比较 。 如 果 它 们 

匹配 ， 则 重复 ， 如 果 它 们 不 匹配 ， 则 这 个 非 确 定性 分 支 拒 绝 。 

c. 如 果 栈 顶 是 符号 $ ， 则 进入 接受 状态 ， 如 果 此 刻 输入 已 全 部 读 完 ， 则 接受 这 个 输 

AF . 

证 明 下 面 形式 化 地 给 出 下 推 目 动机 P=, ET Sdan O 的 构造 细节 。 为 使 构造 
更 清楚 一 些 ， 采 用 一 种 缩写 记号 表示 转移 男 数 ， 用 这 种 记号 方式 ， 机 器 能 够 一 步 把 一 个 字 
符 串 写 人 栈 内 。 同 时 引入 附加 的 状态 ， 实 现 每 次 写 和 人 这 个 字符 串 的 一 个 符号 ， 从 而 模拟 出 
一 次 写 和 人 字符 串 的 动作 。 在 下 述 形式 构造 中 实现 了 这 样 的 模拟 。 

设 g 和 r 是 PDA 的 状态 ，a 属于 3 ，s 属于 了 。 我 们 要 求 PDA 读 a 并 且 弹 出 s 时 ， 
从 g 到 rr， 而且 要 它 同 时 把 整个 字符 串 妈 二 wi…w 推 人 栈 。 可 以 如 下 完成 这 个 动作 : 引入 新 
的 状态 g,,… ,9 1， 并 且 令 转移 函数 如 下 : 

Òlqrass) E Cq vur) 
O(q, see) = { (q; sui—1)} 
Olgy EE) = {Cq sui) ) 
Stet) = {Ora} 

使 用 记号 (r,u)€E6(g,a,s) 表示 当 g 是 P 的 状态 ,a 是 下 一 个 输入 符号 以 及 s ERM 
符号 时 ，PDA P 能够 读 a 和 弹出 ss， 然后 把 字符 串 u HEA 
栈 和 转移 到 状态 >。 图 2- 10 形象 地 描述 了 这 个 动作 的 

P ØRER Q S {larar ,qioop，qaccept} UE» RHE HR 
现 刚 才 描 述 的 缩写 所 需要 的 状态 集合 ， 开 始 状 态 为 qg,， 
只 有 一 个 授 受 状态 accept & 

转移 函数 定义 如 下 。 从 初始 化 栈 开 始 ， 把 符号 $| 和 5S 图 2-10 缩写 〈r,zyz)E 
HEAR, SC BLADE 1 的 非 形式 描述 是 : 6 (gn,e,e) = Some Wee 
{Cdn 39) ， 然 后 进行 步骤 2 主 循环 中 的 转移 。 

首先 ， 处 理 情 况 (a)， 这 时 栈 项 是 一 个 变 元 。 令 Sloop A) {oop wW) |A>w ER 
中 的 一 条 规则 } 。 

其 次 ， 处 理 情 况 (b)， 这 时 栈 项 是 一 个 终结 符 。 令 SCqioo ,aya) 一 {(qloo，e))。 

最 后 ， 处 理 情况 (c)， 这 时 栈 顶 是 空 栈 标记 符 $ 。 令 Sloop $ = { accept E)? o 

图 2- 11 给 出 了 PP 的 状态 图 。 m 

利用 在 引 理 2.13 中 开发 的 过 程 ， 
把 下 述 CFG G 转换 成 一 台 PDA Pi. 

S—aTb|b 
T— Tale 
转移 函数 如 图 2- 12 所 示 。 s 

下 面 证 明和 定理 2. 12 ØRA. X FED mR 

们 给 出 一 个 把 CFG 转换 成 PDA 的 过 程 ， 主 要 思想 图 2-11 PP 的 状态 图 





e 4 w 对 于 规则 A 一 w 
aae ”对 于 终结 符 a 
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是 设计 自动 机 ， 使 得 它 模 拟 文法 。 现 在 要 给 出 一 个 以 相反 方式 进行 的 过 程 : 把 PDA 转换 
成 CFG， 设 计 模拟 自动 机 的 文法 。 这 项 工作 更 具 挑战 性 , “程序 设计 ”一 台 自 动机 比 “ 程 
序 设计 ”一 个 文法 容易 。 

如 果 一 个 语言 被 一 台 下 推 自动 机 识别 ， 则 它 是 上 下 文 无 关 的 。 

证 明 思 路 现 有 一 台 PDA 已 ， 要 构造 一 个 CFG G, EFE 尸 接受 的 所 有 字符 串 。 换 
言 之 ， 如 果 一 个 字符 串 能 使 已 从 它 的 起 始 状态 转移 到 一 个 接受 状态 ， 则 G 应 该 产生 这 个 
FFB 

为 了 获得 这 个 结果 ， 我 们 设计 一 个 能 做 更 多 事情 的 文法 。 对 于 P 的 每 一 对 状态 p 和 
gq， 文 法 有 一 个 变 元 Am 。 它 产生 所 有 能 够 把 已 从 和 空 栈 一 块 带 到 g 和 空 栈 的 字符 串 。 
可 以 看 出 不 管 栈 的 内 容 在 状态 P 时 是 什么 ， 这 样 的 字符 串 也 能 够 把 PP 从 p 和 带 到 gq， 并 且 保 
持 栈 的 内 容 在 状态 q 和 在 状态 p 时 一 样 。 

首先 ， 为 了 简化 工作 ， 对 P 作 轻 微 修改 ， 使 其 具有 以 下 三 个 特点 : 

1. 有 唯一 的 接受 状态 gw。 

2. 在 接受 之 前 清空 栈 。 

3. 每 一 个 转移 把 一 个 符号 推 人 栈 〈 推 人 动作 ) ， 或 者 把 一 个 符号 弹出 栈 〈 弹 出 动作 )， 
但 不 同时 做 这 两 个 动作 。 

使 PP 具有 特点 1 和 特点 2 较 容易 ， 使 PP 具 有 特点 3 就 要 把 每 一 个 同时 弹出 和 推 入 的 转 
移 替 换 成 两 个 转移 ， 中 间 要 经 过 一 个 新 的 状态 ; 把 每 一 个 既 不 弹出 也 不 推 人 的 转移 替换 成 
两 个 转移 ， 先 推 入 任意 一 个 栈 符号 ， 然 后 再 把 它 弹 出 。 

要 设计 G， 使 得 Ay 产 生 把 P A p 带 到 g 并 且 以 空 栈 开始 和 结束 的 所 有 字符 串 ， 必 须 
了 解 P 对 这 样 的 字符 串 如 何 运 行 。 对 于 任何 一 个 这 样 的 字符 串 x， 因 为 P 的 每 一 个 动作 或 
者 是 推 人 或 者 是 弹出 ， 但 是 对 空 栈 不 能 弹出 ， 所 以 已 对 z 的 第 一 个 动作 一 定 是 推 人 人。 类 似 
地 ， 因 为 在 结束 时 栈 是 空 的 ， 所 以 对 z 的 最 后 一 个 动作 一 定 是 弹出 。 

在 书 对 zz 的 计算 过 程 中 可 能 出 现 两 种 情况 : 仅 在 计算 的 开始 和 结束 时 ， 栈 可 能 是 空 
的 ; 或 者 除开 始 和 结束 时 之 外 ， 在 计算 中 的 某 个 地 方 ， 栈 变 成 空 的 。 如 果 是 前 一 种 情况 ， 
最 后 弹出 的 符号 一 定 就 是 开始 时 推 人 的 那个 符号 。 用 规则 Am 一 aA-2 模拟 前 一 种 情况 ， 
其 中 a 是 在 做 第 一 个 动作 时 读 到 的 输入 符号 ，& 是 在 做 最 后 一 个 动作 时 读 到 的 输入 符号 ，r 
ERE p 后 面 的 状态 ，; Æq 的 前 一 个 状态 。 用 规则 Ap 一 AmAz= 模 拟 后 一 种 情况 ， 其 中 > 
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是 栈 在 计算 中 间 变 成 空 的 时 候 的 状态 。 

证 明 设 P=(Q,3, 帮 ,6,go,{qiccent})， 要 构造 G。G 的 变 元 集 是 {Ap 1p,9EQ}， 起 
始 变 元 是 Au 。 下 面 三 点 描述 了 G 的 规则 

1. 对 每 一 个 pogor,s€Q,uCr Ma,bE>d., MR Elp as) 包含 (r,u) H d(s,b,u) 
包含 (gq,e)， 则 把 规则 App 一 aAnb 放 入 G 中 。 

2. 对 每 一 个 p,g,rEQ， 把 规则 AAAA G 中 。 

3. 最 后 ， 对 每 一 个 EQ， 把 规则 Ays 一 2 MAG P., 

可 以 从 图 2- 13 和 图 2- 14 获得 一 些 关 于 这 个 构造 的 直觉 。 





由 4 ,产生 由 4 产生 


图 2-13 对 应 规则 Am ArAnA PDA 计算 





由 4,, 产 生 
图 2- 14 对 应 规则 Ap. >aA,.b 的 PDA 计算 


下 面 证 明 Am 产生 z 当 且 仅 当 z 能 够 把 P 从 状态 p 和 空 栈 一 块 带 到 状态 q 和 空 栈 ， 从 
而 证 明 上 述 构造 是 正确 的 。 把 当 且 仅 当 条 件 中 的 每 一 方向 作为 一 个 单独 的 断言 。 
See 如果 A, Fer, N riie P 从 户 和 空 栈 一 块 带 到 g HER, 
通过 对 从 Am 到 z 的 派生 步 数 进行 归纳 来 证 明 这 个 断言 。 
归纳 基础 ”派生 只 有 一 步 。 

只 有 一 步 的 派生 一 定 使 用 一 条 右 端 不 含 变 元 的 规则 。 在 G 中 右 端 不 出 现 变 元 的 规则 只 
REE Ape W, 输入 e 把 P 从 p 和 空 栈 带 到 p 和 空 栈 ， 从 而 证 明了 归纳 基础 。 

归纳 步骤 ”假设 断言 对 长 度 不 超过 的 派生 成 立 ， 其 中 & 宇 1， 下 面 证 明 断 言 对 长 度 为 
k 十 1 的 派生 也 成 立 。 

假设 Au >r 使 用 & 十 1 步 。 该 派生 的 第 一 步 是 Ap 二 aA wb 或 A 二 ApmAwm， 分 别处 理 
这 两 种 情况 。 

对 于 第 一 种 情况 ,根据 z 中 由 A; 产生 的 部 分 y， 有 x 二 ayb， 因 为 As >y 使 用 & 步 ， 
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根据 归纳 假设 ，P 能 够 从 r 和 空 栈 一 块 转移 到 s 和 空 钱 。 因 为 Am 一 aA4A- BG 的 一 条 规 
则 ， 故 对 某 个 栈 符号 G，65(p,a,e) 包含 (rou) 和 65(Cs,b,u) 包含 (qe), FH, MEP 
MRS p 和 空 栈 开 始 ， 那 么 在 读 到 a 后 ， 它 能 够 转移 到 状态 r, FHE u 推 人 栈 顶 。 然 后 
读 y， 把 它 带 到 s， 并 且 在 栈 中 留 下 ww。 接着 在 读 到 b 后 ， 它 能 够 转移 到 qg， 并 且 把 x 弹出 
栈 。 因 此 , x REIHE P 从 p 和 空 栈 带 到 gq 和 空 栈 。 

对 于 第 二 种 情况 ,根据 z 中 由 A, 和 An 分 别 产 生 的 部 分 > 和 =， 有 >z 一 yz。 因 为 Ar 之 y 
和 An 全 > 都 不 超过 &A 步 ， 根 据 归 纳 假设 ，y 能 够 把 P A pEr, z 能 够 把 P Wr Hq, 
并 且 在 派生 的 开始 和 结束 时 都 是 空 栈 。 因 此 ，zx 能 够 把 P 从 p 和 空 栈 带 到 gq 和 空 栈 。 这 就 
完成 了 归纳 步骤 。 

如 果 工 能 够 把 P 从 p 和 空 栈 带 到 g 和 空 栈 ， 则 Am 产生 工 。 

通过 对 输入 x，P 从 p 和 空 栈 到 g 和 空 栈 的 计算 步 数 作 归 纳 ， 来 证 明 这 个 断言 。 

归纳 基础 ”计算 有 0 步 。 

如 果 计 算 有 0 步 ， 则 它 开 始 和 结束 在 同一 个 状态 ， 比 如 说 是 p。 因 此 ， 我 们 要 证 明 
Ap 一 z。 在 0 步 内 ， 忆 无 法 读 入 任何 字符 ， 故 x 二 e。 根 据 G 的 构造 ， 它 有 规则 Ape, 
这 就 证 明了 归纳 基础 。 

归纳 步骤 ”假设 断言 对 长 度 不 超过 & 的 计算 成 立 ， 其 中 & 之 0， 要 证 明 断 言 对 长 度 为 
k 十 1 的 计算 也 成 立 。 

假设 PP 有 一 个 计算 ,在 & 十 1 AA Hp 连同 空 栈 一 块 带 到 g， 或 者 仅 在 计算 的 开始 
和 结束 时 栈 是 空 的 ， 或 者 在 其 他 某 个 地 方 栈 也 变 成 空 的 。 

对 于 第 一 种 情况 ， 第 一 步 推 人 栈 的 符号 一 定 和 最 后 一 步 弹 出 栈 的 符号 相同 ， 把 这 个 符 
号 称 为 u。 设 a 是 第 一 步 读 的 输入 符号 ，& 是 最 后 一 步 读 的 输入 符号 , r 是 第 一 步 后 的 状 
态 ，s 是 最 后 一 步 之 前 的 状态 ， 那 么 ，6(p,a,e) 包含 (rou) HC, bu) 包含 (q), M 
mÆ G 中 有 规则 Am->aA-2。 

令 y 是 z 中 不 包括 a 和 6 在 内 的 部 分 ， 即 x 二 ayb， 输 入 yy 能够 把 P 从 r 带 到 s 而 不 触 
及 栈 底 的 符号 w， 从 而 PP 能够 在 输入 y 上 连同 空 栈 一 块 从 r 转移 到 s。 由 于 已 经 从 原来 关 
于 工 的 计算 中 删 去 第 一 步 和 最 后 一 步 ， 故 关于 y 的 计算 有 (k 十 1) 一 2 二 一 1 步 ， 于 是 ， 
根据 归纳 假设 有 As>y, Mill, A>r. 

对 于 第 二 种 情况 ， 设 > 是 关于 z 的 计算 中 除开 始 和 结束 之 外 栈 变 成 空 的 时 候 的 状态 ， 
FÆ., WAMA p 到 r 和 从 rr 到 g 的 部 分 都 不 超过 & 步 ， 记 yy 为 计算 前 一 部 分 读 的 输入 ，z 
为 后 一 部 分 读 的 输入 ,根据 归 纳 假设 有 Ap 过 y 和 A 过 z。 由 于 G 中 有 规则 Aw- 一 AmwAn， 
故 Am 二 x， 证 毕 。 

这 就 完成 了 引 理 2. 15 和 定理 2. 12 的 证 明 。 a 

刚才 证 明了 下 推 自 动机 识别 上 下 文 无 关 语言 类 ， 这 个 证 明 使 
我 们 能 够 给 出 正则 语言 和 上 下 文 无 关 语言 的 关系 ， 如 图 2-15. N 
为 每 一 个 正则 语言 都 可 以 用 有 穷 自 动机 识别 ， 而 每 一 台 有 穷 自 动 
机 都 自动 地 是 一 台 下 推 自动 机 ， 所 以 只 要 不 考虑 它 的 栈 ， 每 一 个 
正则 语言 也 是 一 个 上 下 文 无 关 的 语言 。 图 2-15 正则 语言 与 上 下 

每 一 个 正则 语言 都 是 上 下 文 无 关 的 。 文 无 关 语言 的 关系 
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2.3 非 上 下 文 无 关 语 言 


本 节 提 出 一 项 技术 ， 可 以 用 来 证 明 某 些 语言 不 是 上 下 文 无 关 的 。 在 1.4 节 中 介绍 了 泵 
引 理 ， 用 来 证 明 某 些 语言 不 是 正则 的 ， 本 节 对 上 下 文 无 关 语 言 给 出 类 似 的 泵 引 理 ， 它 指出 
每 一 个 上 下 文 无 关 语言 都 有 一 个 特殊 的 值 ， 称 为 泵 长 度 (pumping length)， 使 得 这 个 语言 
中 的 所 有 长 度 等 于 或 大 于 这 个 值 的 字符 串 都 能 够 被 “抽取 ”， 这 一 次 抽取 的 意思 要 复杂 一 
点 ， 它 是 指 字 符 串 能 被 划分 成 5 段 ， 其 中 第 2 段 和 第 4 段 可 以 同时 重复 任意 多 次 ， 并 且 所 
得 到 的 字符 串 仍 然 在 这 个 语言 中 。 


关于 上 下 文 无 关 语 言 的 泵 引 理 


(关于 上 下 文 无 关 语 言 的 泵 引 理 ) ”如 果 A 是 上 下 文 无 关 语 言 ， 则 存在 数 
p CREE), 使 得 A 中 任何 一 个 长 度 不 小 于 p HFRS s 都 能 被 划分 成 5 段 ;二 wvxyz 且 
满足 下 述 条 件 : 

1. 对 于 每 一 个 i20, uviryiz EA; 

2. |vy|>0; 

3. lurs Sh, 

4s 被 划分 成 wvzyz 时 ， 条 件 2 保证 v 或 y 不 是 空 串 ， 和 否则 定理 自动 成 立 ， 但 毫 无 意 
义 。 条 件 3 RE v, r Aly 三 段 在 一 起 的 长 度 不 超过 p， 这 个 技术 性 条 件 在 证 明 某 些 语言 
不 是 上 下 文 无 关 语 言 时 有 用 。 

证 明 思 路 it ACFL, GEPA 的 CFG。 要 证 明 A 中 任何 足够 长 的 字符 串 s 都 
能 够 被 抽取 ， 并 且 抽 取 后 的 字符 串 仍 在 A 中 。 

设 s 是 A 中 一 个 很 长 的 字符 串 (后 面 将 明确 给 出 “很 长 ”的 意思 )。 由 于 s 在 A 中 ， 
它 可 以 用 G 派生 出 来 ， 从 而 有 一 棵 语法 分 析 树 。 由 于 s 很 长 ，s 的 语法 分 析 树 一 定 很 高 ， 
也 就 是 说 ， 这 棵 语法 分 析 树 一 定 有 一 条 很 长 的 从 树 根 的 起 始 变 元 到 树叶 上 的 终结 符 的 路 
径 。 根 据 铝 巢 原 理 ， 在 这 条 长 路 径 上 一 定 有 某 个 变 元 R 重复 出 现 。 正 如 图 2- 16 所 示 ， 这 
种 重复 使 得 我 们 可 以 用 第 一 次 出 现 的 RR 下 面 的 子 树 代 蔡 第 二 次 出 现 的 R 下 面 的 子 树 ， 并 
且 仍 得 到 一 棵 合法 的 语法 分 析 树 。 由 此 ， 可 以 像 图 中 表示 的 那样 ， 把 * 切 成 5 E uvryz, 
重复 第 2 段 和 第 4 段 ， 得 到 的 字符 串 仍 在 A 中。 换言之， 对 任意 的 ;之 0，xvizyizEA。 


T r 





Vv x y 


图 2-16 语法 分 析 树 上 的 外 科 手 术 


下 面 转 到 获得 条 引 理 中 全 部 3 个 条 件 的 细节 上 来 ， 还 要 说 明 如 何 计算 泵 长 度 p. 

证 明 设 G 是 关于 CFL A 的 一 个 CFG, 令 5 是 规则 右边 符号 数 的 最 大 值 (假设 大 于 
等 于 2)。 在 G 的 任 一 棵 语法 分 析 树 中 ， 一 个 结 点 最 多 有 6 个 儿子 ， 换 言 之 ， 离 起 始 变 元 1 
步 最 多 有 6。 片 树叶 ; 离 起 始 变 元 不 超过 2 步 最 多 及 片 树叶 ; 离 起 始 变 元 不 超过 h 步 最 多 
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A b HRI. ALI, QR A oo Br PAY tes BEN ath, WW EAE ES E 
bY, RZ., MIR— TPE ET BIRR ARN Oo +1, WARE BY ETRE OE BDH 
BG 中 变 元 的 数目 为 | V |. CRE p=, WA 中 任 一 长 度 不 小 于 的 字符 
Ps 的 语法 分 析 树 的 高 度 不 小 于 |V | 十 1， 这 是 因为 局 ”之 六 ”十 1。 

为 说 明 如 何 抽取 s, B rE ;的 一 棵 语法 分 析 树 ， 如 果 s 有 若干 语法 分 析 树 ， 取 r 是 
结 扩 数 最 少 的 语法 分 析 树 ， 由 于 zt 的 高 度 不 小 于 IV| 十 1， 从 而 从 根 节点 出 发 的 最 长 路 径 
的 长 度 不 小 于 IV| 十 1 并 包含 1V| 十 2 个 结 点 ， 其 中 一 个 结 点 为 终结 符 ， 其 他 为 变 元 。 因 
此 该 路 径 至 少 有 |V| 十 1 个 变 元 ， 因 为 只 有 树叶 是 终结 符 ， 故 这 条 最 长 的 路 径 上 至 少 有 


VI+ TÆ., 而 G 只 有 |V| 个 变 元 ， 故 有 某 个 变 元 R 在 这 条 路 径 上 不 只 出 现 一 次 。 
为 了 后 面 的 方便 ， 选取 R 为 这 条 路 径 上 在 最 下 面 的 |V| 十 1 个 变 元 中 重复 出 现 的 变 元 。 


按照 图 2- 16 把 s 划分 成 wvzyz。 在 每 一 个 RR 的 下 面 有 一 棵 子 树 ， 它 产生 * 的 一 部 分 。 上 
面 的 下 有 一 棵 较 大 的 子 树 ， 产 生 vry; 下 面 的 R 有 一 棵 较 小 的 子 树 ， 恰 好 产生 zx。 这 两 棵 树 


由 同一 个 变 元 产生 ， 因 而 可 以 相互 奉 换 ， 并 且 仍 得 到 一 棵 有 效 的 语法 分 析 树 。 对 于 每 一 个 
;1， 用 较 大 的 子 树 反复 替换 较 小 的 子 树 以 给 出 字符 串 uvizyiz 的 语法 分 析 树 ， 用 较 小 的 子 树 


符 换 较 大 的 子 树 以 产生 字符 串 wxz。 这 就 证 实 了 引 理 中 的 条 件 1， 下 面 转 到 条 件 2 和 条 件 3。 

为 了 得 到 条 件 2， 必 须 保 证 v R y 不 都 是 s。 如 果 它 们 都 是 s， 则 用 较 小 的 子 树 替 换 较 
大 的 子 树 得 到 的 语法 分 析 树 的 结 点 比 t 少 ， 并 且 仍 然 能 够 产生 *。 但 这 是 不 可 能 的 ， 因 为 
我 们 已 经 选取 z 为 * 的 结 点 数 最 少 的 语法 分 析 树 ， 这 也 是 为 什么 要 这 样 选取 r 的 原因 。 


为 了 得 到 条 件 3， 必 须 保 证 wzy 的 长 度 不 超过 p, Æ ; 的 语法 分 析 树 中 ， 上 面 的 R 


正则 语言 的 泵 引 理 证 明 非 正则 性 的 有 关 问 题 。 


关于 用 泵 引 理 证 明 语 言 不 是 上 下 文 无 关 的 提示 ， 请 复习 例 1. 38， 在 那里 讨论 了 用 关于 
用 泵 引 理 证 明 语 言 


产生 zzy。 我 们 选取 R 使 得 它 的 两 次 出 现 都 落 在 所 在 路 径 的 最 下 面 的 |V| 十 1 个 变 元 中 ， 
不 是 上 下 文 无 天 的 。 


而 这 条 路 径 又 选取 的 是 语法 分 析 树 中 的 最 长 路 径 ， 因 此 R 产生 ory 的 子 树 的 高 度 不 超过 
IV| 十 1。 这 么 高 的 树 只 能 产生 长 度 不 超过 bV H =p 的 字符 串 。 


= 
B= {a” b"c” |n0} 


假设 Bye CFL， 要 得 出 矛盾 的 结果 。 令 p 是 B 的 泵 长 度 ， RERS, LA p 一 定 
存在 。 选 取 字 符 串 s=aPbec?, WA, s 属于 B 且 长 度 不 小 于 p。 泵 引 理 称 ;能够 被 抽取 ， 
但 是 我 们 证 明 这 是 不 可 能 的 ， 换 言 之 ,我 们 证 明 不 管 怎么 把 s 划分 成 wvrxyz， 总 要 违反 泵 
引 理 中 的 一 个 条 件 。 

首先 ， 条 件 2 规定 v 或 者 y FRESH, AARETE v 和 yy 是 否 含有 一 种 以 上 的 符 
号 ， 考 虑 下 述 两 种 情况 : 
引 理 的 条 件 1， 了 矛盾 。 


1. 当 wv 和 yy 都 只 含有 一 种 符号 时 ，a 和 hb 或 b 和 fc 不 会 都 在 吉 中， 同样 也 不 会 都 在 y 


中 ， 这 时 字符 串 uv’ zyz 不 可 能 含有 个 数 相同 的 a、b 和 c。 因 此 ， 它 不 属于 吾 ， 这 违反 泵 
些 符号 的 次 序 不 可 能 正确 。 因 此 它 不 属于 吾 ， 矛 盾 。 


2. 当 wv 或 者 y 含有 一 种 以 上 符号 时 ，xuzzyzz 可 能 含有 个 数 相 同 的 3 种 符号 ， 但 是 这 
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这 两 种 情况 必 有 一 个 发 生 ， 因 为 这 两 种 情况 都 产生 矛盾 ， 故 矛盾 是 不 可 避免 的 ， 因 
此 ,假设 B 是 CFL 错误 ， 于 是 ， 得 证 BA CFL. a 
& C= {aibict |O<i<j<k}, ARS|BiEW C 不 是 CFL。 该 语言 很 像 例 
2. 20 中 的 语言 B,， 但 证 明 它 不 是 上 下 文 无 关 语言 要 复杂 一 些 。 
假设 C 是 CFL， 要 得 出 矛盾 。 令 p 是 泵 引 理 给 出 的 泵 长 度 ,， 使 用 前 面 使 用 过 的 字符 
串 s 二 a?b?ct? ,但 是 这 次 必须 既 “ 抽 进 ” 又 “抽出 ”。 令 ;二 wvxyz， 并 且 再 次 考虑 例 2. 20 
中 出 现 的 两 种 情况 。 
1. v 和 yy 都 仅 含 一 种 符号 。 注 意 在 前 面 情 况 1 中 使 用 的 理由 不 再 适用 ， 这 是 因为 C 的 
FIE a, b, c 的 个 数 不 必 相 等 ， 而 只 需 是 非 降序 的 。 我 们 必须 更 仔细 地 分 析 这 种 情况 
才能 证 明 ;不 可 能 被 抽取 。 注 意 到 由 于 v 和 yy 都 只 含 一 种 符号 ，a、b 和 c 中 有 一 种 不 出 现 
在 v 和 yy 中。 根据 哪个 符号 不 出 现 ， 把 这 种 情况 进一步 分 成 3 种 子 情况 : 
a a 不 出 现 。 用 抽出 得 到 字符 串 uVryz=urz, CERA a 的 个 数 与 :的 相同 ,但 是 b 
的 个 数 或 者 c 的 个 数 比 s 的 少 ， 因 此 ， 它 不 属于 C， 了 矛盾 。 

b. b 不 出 现 。 由 于 w 和 y 不 都 是 空 串 ，a 或 c 必 出 现在 v 或 y 中 。 如 果 a tM, WS 
FP wvwzzxy:z 中 a 比 b 多 ， 从 而 不 属于 C。 如 果 c HA, WSR urey z be 
c 多， 从 而 也 不 属于 C。 不 管 是 哪 种 情况 ， 都 有 了 矛盾 。 

cc 不 出 现 。 则 字符 串 xo2 zy xz 中 a 或 b 比 c 多 ， 从 而 不 属于 C， 了 矛盾 。 

2uKY 含有 一 种 以 上 符号 。xv2z zy z 中 的 符号 不 能 以 正确 的 方式 排列 ， 因 而 它 不 可 
EBFC, FH. 

于 是 ， 得 证 s 不 可 能 被 抽取 ， 违 反 泵 引 理 ， 从 而 C 不 是 上 下 文 无 关 的 。 2 

UER S D={ww|we{0,1}*}, AR5| SUE D 不 是 CFL。( 假 设 D 是 CFL 并 
得 出 矛盾 的 结论 ， 令 p eR BAKHRKE.) 

这 次 选取 字符 串 s 不 那么 明显 。 可 以 取 字 符 串 0?10?1， 它 是 D 的 成 员 且 长 度 大 于 上 p， 
因此 好 像 是 一 个 好 的 候选 对 象 ， 但 是 ， 按 如 下 划分 *， 它 就 能 够 被 抽取 ， 因 而 不 符合 我 们 
的 需要 。 
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HA s 的 其 他 取 法 ， 字 符 串 08120212 直观 上 看 比 前 一 个 字符 串 更 多 地 抓 住 了 语言 
D 的 “本 质 ”， 事 实 上 ， 可 以 证 明确 实 如 此 ， 证 明 如 下 。 

要 证 明 字 符 串 * 王 02120212 不 能 够 被 抽取 ， 用 有 泵 引 理 中 的 条 件 3 限制 划分 s 的 方式 。 
条 件 3 称 ， 将 ;划分 成 ;二 wvxyz， 其 中 |vzry| 三 p，;s 能 被 抽取 。 

K. TP wzy 一 定 横 跨 s 的 中 点 ， 否 则 ， 如 果 vey 位 于 s 的 前 一 半 ， 把 * 抽 成 
uv’ xry’ z 时 ，1 移 到 后 一 半 的 第 一 个 位 置 ， 因 此 uryt z 不 可 能 是 ww 的 形式 。 类 似 地 ， 
WMR vry 位 于 s 的 后 一 半 ， 把 * 抽 成 wozzyzz 时 ，0 移 到 前 一 半 的 最 后 一 个 位 置 ， 因 此 
uv’ ry z 也 不 可 能 是 ww 的 形式 。 

但 是 ， 如 果子 串 vry 横 跨 s 的 中 点 ， 把 sihhi urz, CÉ oloi, Ep iR jA 
可 能 都 等 于 p。 这 个 字符 串 不 是 ww 的 形式 。 于 是 ，* 不 能 够 被 抽取 ， 从 而 万 不 是 CFL。 m 


2.4 确定 型 上 下 文 无 关 语 言 
回想 一 下 ， 确 定型 有 穷 自动 机 和 非 确定 型 有 穷 自 动机 具有 等 价 的 语言 识别 能 力 。 相 


反 ， 非 确定 型 下 推 自动 机 比 确定 型 下 推 自动 机 具有 更 强 的 能 力 。 我 们 将 看 到 ， 一 些 不 能 由 
确定 型 PDA 识别 的 上 下 文 无 关 语 言 ， 需 要 用 非 确 定型 PDA 来 识别 。 能 被 确定 型 下 推 自 动 
机 (DPDA) 识别 的 语言 称 为 确定 型 上 下 文 无 关 语 言 (DCFL)。 它 是 上 下 文 无 关 语 言 的 一 
个 子 类 ， 并 与 许多 实际 应 用 相关 ， 例 如 : 程序 设计 语言 编译 器 中 语法 分 析 需 的 设计 ， 因 为 
通常 来 说 ， 与 CFL 相 比 ， 语 法 分 析 的 问题 对 DCFL 更 加 容易 。 本 节 将 简要 地 概述 这 一 重 
要 又 迷人 的 主题 。 

在 DPDA 的 定义 中 ， 我 们 遵循 了 确定 性 的 基本 准则 : 在 计算 的 每 一 步 ， 根 据 其 转移 辑 
数 ，DPDA 最 多 只 有 一 种 继续 的 方式 。 和 定义 DPDA 比 定 义 DFA 更 复杂 ， 这 是 因为 DPDA 
可 能 在 不 弹出 一 个 栈 符号 的 情况 下 读 和 一 个 输入 符号 ， 反 之 亦 然 。 相 应 地 ，DPDA 的 转移 
pA RTE = 转移 ， 尽 管 这 在 DFA 中 是 被 禁止 的 。e 转 移 有 两 种 形式 : e 输 入 转移 (ein- 
put move) 对 应 于 6(g,e,X)，e- 栈 转移 (sstack move) 对 应 于 6Clg,a,e)。 也 可 以 在 一 次 转 
移 中 把 这 两 种 形式 结合 起 来 ， 对 应 于 6(g,e,e)。 如 果 一 台 DPDA 能 够 在 某 种 情况 下 做 = 转 
移 ， 那 么 在 这 种 情况 下 涉及 处 理 非 es 符号 的 转移 是 被 禁止 的 ， 否 则 可 能 出 现 多 个 合法 的 计 
算 分 支 的 情况 ， 进 而 导致 非 确 定型 的 行为 。 形 式 化 定义 如 下 : 

确定 型 下 推 自动 机 (deterministic pushdown automaton) 是 一 个 6 元 组 
(QZ Bo HPQ. fF 都 是 有 穷 集 合 ; HH 

1.Q 是 状态 集 ， 

2. 卫 是 输入 字母 表 ， 

3. 卫 是 栈 字 母 表 ， 

4. 6:QX5. XI. 一 (QXT.)U{S} 是 转移 函数 ， 

5.d0oEQ 是 起 始 状态 ， 

6. FCQ 是 接受 状态 集 。 

转移 函数 6 必须 满足 如 下 条件 : 

给 定 任意 一 组 gE€EQ, a€5 和 XET,， 

OCGisd eX) (om OGG 12 22) A OC ase se) 
中 有 二 私有 一 个 和 攻 是 加。 

转移 函数 可 能 输出 一 个 ry) 形式 的 单 次 转移 ， 或 输出 名 来 指示 不 做 任何 动作 。 举 
一 个 例子 来 说 明 这 些 可 能 性 。 假 设 转移 函数 为 8 的 一 个 DPDA M 位 于 状态 gqg， 下 一 个 输入 
符号 是 a， 栈 顶 符 号 是 Xx。 如 果 6(g,a,7x)= 二 (r,y)， 那 么 M 读 人 a， 从 栈 中 弹出 x， 进 入 状 
Ar, FAW y RAR. ME, Adla.a.n=O, MA4MMFRACH, 没有 读 入 a 并 
弹出 x 对 应 的 转移 。 这 种 情况 下 ，6 的 条 件 要 求 6(q,a,e)，6(g,e,X)，6(q,e,e) 之 一 非 
a, SIG M 作 相 应 转移 。8 的 条 件 避 免 了 DPDA 在 同样 的 情况 下 执行 两 种 不 同 的 动作 
(例如 : Æla r) ADH 6(g,a,e) 关 台 就 会 发 生 这 种 情形 )， 从 而 确保 了 确定 型 行为 。 当 
栈 非 空 时 ，DPDA 在 任何 状况 下 都 只 有 一 个 合法 的 转移 。 奉 栈 为 空 ， 只 有 当 转 移 肾 数 指 明 
一 个 弹出 e 的 转移 时 ，DPDA 才能 转移 。 否 则 ，DPDA 没有 合法 的 转移 ， 拒 绝 ， 同 时 不 再 
读 取 剩余 的 输入 。 

DPDA 接受 的 方式 与 PDA 相同 。 如 果 DPDA 在 读 入 输入 字符 串 的 最 后 一 个 符号 后 进 
入 接受 状态 ， 则 接受 这 个 字符 串 。 其 他 任何 情况 下 ， 则 拒绝 这 个 字符 串 。 两 种 情况 下 会 产 
生 拒 绝 : 其 一 ，DPDA 读 入 了 全 部 输入 ， 但 最 后 没有 进入 接受 状态 ; 其 二 ，DPDA 没有 成 
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功 地 读 完 整个 输入 字符 串 。 当 DPDA 尝试 弹出 一 个 空 栈 ， 或 者 当 DPDA 在 某 个 位 置 后 不 
再 读 入 任何 输入 而 是 执行 无 尽 的 = 输入 转移 序列 时 第 二 种 情况 就 可 能 出 现 。 

DPDA 的 语言 称 为 确定 型 上 下 文 无 关 语 言 (deterministic context-free language) 。 

GHD 例 2.9 中 的 语言 (0"1"|n>0) 是 一 个 DCFL。 通 过 在 一 个 不 可 能 被 接受 的 
“ 死 ” 状 态 中 添加 缺失 状态 、 输 入 符号 和 栈 符号 组 合 的 转移 ， 可 以 容易 地 将 该 语言 的 PDA 
Mi 修改 为 一 台 DPDA。 

fil 2.10 和 例 2.11 给 出 的 CFL{aibict|i,j,k 宇 0 H i 二 j 或 i 二 k) 和 {ww | we 
{0,1}*} 都 不 是 DCFL。 问 题 2. 27 和 问题 2. 28 说 明了 非 确 定性 是 识别 这 些 语言 的 必 
要 条 件 。 a 

有 关 DPDA 的 讨论 自然 地 倾向 于 技术 性 ， 尽 管 本 书 尽 最 大 努力 强调 其 实现 背后 的 主要 
思想 , 但 本 节 内 容 的 难度 仍 大 于 前 面 章节 。 本 节 内 容 并 不 影响 对 本 书后 续 内 容 的 理解 ， 因 
此 如 有 必要 可 以 跳 过 本 节 。 

接 下 来 ， 我 们 介绍 一 个 可 以 简化 后 续 讨 论 的 技术 性 引 理 。 前 文 介 绍 过 ， 当 不 能 成 功 读 
人 全 部 输入 字符 串 时 ，DPDA 拒绝 输入 。 但 是 ， 这 类 DPDA 会 引入 一 些 杂 乱 的 和 情况。 所 
第 ， 下 面 的 引 理 表明 我 们 可 以 通过 转换 DPDA 来 避免 这 种 不 方便 的 情况 。 

任何 一 台 DPDA 都 有 一 台 能 够 读 完整 个 输入 字符 串 的 等 价 DPDA。 

证 明 思 路 4—6 DPDA 试图 弹出 一 个 空 栈 或 者 执行 无 尽 的 ee 输入 转移 序列 时 ， 它 可 
能 不 能 读 和 人 整个 输入 串 。 我 们 称 第 一 种 情况 为 hanging， 第 二 种 情况 为 looping。 用 一 个 特 
殊 符 号 初始 化 栈 可 以 解决 hanging 问题 。 如 果 这 个 符号 在 输入 末端 之 前 被 弹出 栈 ， 那么 
DPDA 读 完 剩 下 的 输入 并 拒绝 。 通 过 识别 looping 情况 发 生 〈 即 不 再 有 输入 符号 被 读 人 )， 
并 重新 对 DPDA 编程 使 其 读 入 并 拒绝 输入 ， 可 以 解决 looping 问题 。 我 们 还 必须 调整 这 些 
修改 来 满足 在 输入 的 最 后 一 个 符号 发 生 hanging 或 者 looping 的 情况 。 如 果 DPDA 在 读 入 
最 后 一 个 符号 之 后 进入 接受 状态 ， 那 么 修改 后 的 DPDA 接受 而 不 是 拒绝 输入 。 

证 明 设 P=(Q,3,T,6,g,,F) 是 一 台 DPDA。 首 先 ， 增 加 一 个 新 的 起 始 状态 dan 
一 个 额外 的 接受 状态 qu、 一 个 新 状态 Aree? URE BRA. MAA re Q, aEd., 
以 及 x，yET 实施 如 下 修改 。 

首先 ， 修 改 尸 使 其 一 旦 进入 接受 状态 ， 就 停留 在 接受 状态 直至 读 和 人 下 一 个 输入 符号 。 
对 每 一 个 9g€ Q， 增 加 一 个 新 的 接受 状态 q, HHE Mqve.D=(r,y), WE d(g,,6.2)= 
(ra，y)。 如 果 gE 下 ， 则 修改 6 使 得 6(g,e,x) 二 (rs,y)。 对 每 一 个 g€EQ 和 a Er, Æla, 
Zz) 一 (r,y)， 则 置 6(q, ,a,z) 一 (r,y)。 设 下 是 新 、 旧 接受 状态 的 集合 。 

接 下 来 ， 通 过 用 一 个 新 的 特殊 栈 符号 $ 初始 化 栈 来 修改 P， 使 其 在 尝试 弹出 空 栈 时 拒 
绝 。 如 果 P 随后 在 非 接受 状态 探测 到 $ ， 则 进入 que 并 且 扫 描 输 入 到 末端 。 如 果 已 在 接 
受 状态 探测 到 $ ， 则 进入 q,..。.。 若 还 有 输入 处 于 未 读 状态 ，P 进入 qoa 并 且 扫 描 输入 到 
末端 。 形 式 化 地 ， 置 lgu) =q $) MrceEVAMd(q.a,.rD4AO, ZqEF, WH 
ara $) =a REF NWE d(qra,$)=Cagcep E22 WELZ, (god 
E = (Greiect 22 UAB OCAaccept 949) = reject *©) © 

最 后 ， 修 改 PP 使 其 拒绝 ， 避 免 在 输入 末端 之 前 执行 无 尽 的 e 输 入 转移 序列 。 对 每 一 个 
qEQM LET, 4 PAIK q FRH xETT 是 栈 顶 元 素 时 ， 如 果 PP 不 再 弹出 xz 以 下 的 符号 也 
不 再 读 人 任何 输入 符号 ， 则 称 Cr) X looping 状况 。 如 果 P 忆 在 随后 的 转移 中 进入 接受 状 
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AS, WK looping 状况 是 接受 的 ， 否则 是 拒绝 的 。 如 果 (g,x) 是 接受 的 looping Kh, B 
00699692) = (0 s€)» A (qx) 是 拒绝 的 looping 状况 ， 置 S(qye,Z) 一 (qieu Ela & 
为 简便 起 见 ， 在 后 面 的 讨论 中 我 们 假设 DPDA 读 入 全 部 的 输入 。 


2.4.1 DCFL 的 性 质 

本 小 节 将 探究 DCFL 类 的 封闭 性 和 非 封 闭 性 ， 并 由 此 说 明 CFL 不 是 DCFL. 

DCFL 类 在 补 运算 下 封闭 。 

证 明 思 路 ”将 一 台 DFA 的 接受 状态 和 非 接受 状态 进行 交换 ， 得 到 一 台 识 别 语言 补 集 
的 新 DFA， 因 此 证 明正 则 语言 类 在 补 运 算 下 封闭 。 同 样 的 方法 适用 于 DPDA, 但 有 一 个 
问题 。 在 输入 字符 串 的 末端 ，DPDA 进入 转移 序列 的 接受 和 非 接受 状态 都 可 能 接受 输入 。 
这 种 情况 下 ， 交 换 接受 和 非 接受 状态 仍然 会 接受 。 

通过 修改 DPDA 限制 接受 的 出 现 ， 可 以 解决 这 个 问题 。 对 输入 的 每 一 个 符号 ， 只 有 当 
修改 后 的 DPDA 将 要 读 和 人 下 一 个 符号 时 ,该 DPDA 才能 够 进入 一 个 接受 状态 。 换 言 之 ， 
只 有 读 人 状态 (总 是 读 人 输入 符号 的 状态 ) 才 可 能 是 接受 状态 。 因 此 ， 只 有 在 这 些 读 人 状 
态 中 交换 接受 状态 和 非 接受 状态 ， 才 能 转换 DPDA 的 输出 。 

WEAR 首先 按照 引 理 2. 25 的 证 明 中 的 描述 修改 已 ， 令 机 器 QET, qg FO 为 修改 
结果 。 这 个 机 器 总 是 读 人 全 部 输入 字符 串 。 此 外 ， 一 旦 进入 一 个 接受 状态 ， 它 停留 在 接受 
状态 直到 它 读 入 下 一 个 输入 符号 。 

为 了 实现 证 明 思 路 ， 我 们 需要 识别 读 和 状态。 如果 DPDA 在 状态 g 读 入 一 个 输入 符号 
a E53 MRA TAR CBI ela AD) WANAE 9 为 一 个 读 入 状态 。 然 而， 如 果 DPDA iz 
Aa 并 且 弹 栈 ， 那 么 根据 弹出 的 符号 决定 读 人 操作 ， 因 此 将 这 一 步 一 分 为 二 : 弹出 和 接 下 
来 的 读 入 。 对 aEY 和 zEFPR， 如 果 8Ca,a,z)= 王 (r,y)， 那 么 增加 一 个 新 状态 gq, 并 且 修 改 6 
IEF elger) =q, sE), lq, ae) 一 (Cry)。 认 和 定 9 为 一 个 谈 人 状态 。 状 态 q, 从 不 弹 栈 ， 
所 以 它 的 动作 与 栈 内 容 无 关 。 如 果 gE 下， 认定 q, 为 一 个 接受 状态 。 最 后 ， 从 所 有 非 读 人 
状态 中 移 除 接受 状态 的 认定 。 修 改 后 的 DPDA 等 价 于 已， 但 是 对 每 个 输入 符号 ， 当 DPDA 
将 要 读 入 下 一 个 符号 时 ， 它 最 多 进入 一 个 接受 状态 。 

现在 ， 对 认定 为 接受 的 读 和 人 状态 进行 转换 (为 非 接受 )。 修 改 后 的 DPDA 识别 语言 
补 集 。 = 

此 定理 说 明 一 些 CFL 并 不 是 DCFL。 @ CFL 的 补 不 是 一 个 CFL， 那 么 该 CFL 也 不 是 
DCFL. Alt, A={a bič |i 关 7 或 了 关 &， 其 中 i,;,k 宇 0} 是 一 个 CFL 但 不 是 一 个 DCFL。 
否则 ，A 若是 一 个 CFL， 问 题 2. 30 的 结果 会 错误 地 认为 A 门 a*b* c* = 二 {a*b"c"*|n 宇 0; 是 
上 下 文 无 关 的 。 

问题 2.23 要 求证 明 在 其 他 常见 的 运算 如 并 、 交 、 星 和 逆 下 DCFL 类 是 不 封闭 的 。 

为 了 简化 讨论 ， 偶尔 我 们 会 考虑 将 一 个 特定 的 标记 符号 -十 添加 到 输入 字符 串 的 末尾 ， 
将 其 称 为 输入 结束 标记 (endmarked input). RTK- 添加 到 DPDA 的 输入 字母 表 。 在 下 
一 个 定理 中 可 以 看 到 ， 添 加 输入 结束 标记 不 会 改变 DPDA 的 能 力 。 然 而 ， 在 设计 DPDA 
时 考虑 输入 结束 标记 ， 可 以 获知 输入 字符 串 的 结束 信息 ， 从 而 简化 设计 难度 。 对 任意 语言 
A， 我 们 用 结束 标记 语言 AT KARAS wd 的 集合 ， 其 中 wea. 

A 是 DCFL 当 且 仅 当 A4 是 DCFL。 
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证 明 思 路 ”证 明 该 定理 的 充分 性 比较 容易 。 令 DPDA P W3 A. DPDA PRM P 直 
A PRA ， 从 而 识别 A- 。 此 时 ， 如 果 在 前 一 个 符号 中 PP 已 经 进入 接受 状态 ， 那 么 P 
接受 。P' 不 再 读 入 -| 之 后 的 任何 符号 。 

为 了 证 明定 理 的 必要 性 ， 4 DPDA P 识别 A- 并 且 构 造 一 个 识别 A 的 DPDA P 。 因 
为 已 读 入 其 输入 ， 因 此 它 模 拟 已 。 在 读 入 每 一 个 输入 符号 之 前 ，P 判定 若 该 符号 为 4 P 
是 否 接受 。 若 是 ，P' 进 入 一 个 接受 状态 。 注 意 ，P 可 能 在 读 人 -| 之 后 进行 栈 操作 ， 因 此 读 
AJ 之 后 需要 根据 栈 的 内 容 来 判定 P 是否 接受 。 当 然 ，P' 不 能 在 任 一 个 输入 符号 时 弹出 
整个 栈 ， 因 此 P 必须 在 不 弹出 栈 的 情况 下 判定 P ERA 之 后 的 动作 。 替 代 方 案 是 PE 
栈 中 存储 额外 的 信息 从 而 允许 P' 立刻 判定 P 是 否 接 受 。 这 个 信息 表明 了 从 哪个 状态 开始 
P 最 终 会 接受 ， 同 时 (可 能 ) 进行 栈 操作 ， 但 不 再 读 和 任何 输入 。 

证 明 我 们 只 给 出 必要 性 证 明 的 细节 。 正 如 证 明 思 路 所 述 ， 令 DPDA P=(Q, 5U 
{4 }, 工 ,6,qo,;F) 识别 A- 并 且 构 造 一 台 DPDA P=, ,09 FO WEA. BE, 
修改 P 使 得 它 的 每 次 转移 都 仅 执行 下 述 操作 之 一 : 读 和 一 个 输入 符号 ; 将 一 个 符号 压 人 
Res 从 栈 中 弹出 一 个 符号 。 通 过 引入 新 状态 很 容易 实现 这 些 修改 。 

P 模拟 已 ， 同 时 维持 一 个 栈 内 容 的 拷贝 并 交错 存储 栈 的 额外 信息 。 每 当 忆 压 和 人 一 个 也 
的 栈 符 号 ，P"' 随 之 压 入 一 个 代表 PP 状态 子 集 的 符号 。 因 此 ， 置 卫 =PUP(CQ) 。 忆 的 栈 中 卫 
的 成 员 与 P(Q) 的 成 员 交 错 存 储 。 如 果 REP(Q) 是 栈 顶 符号 ， 那么 从 R 的 任 一 状态 开始 
P, 最 终 会 接受 并 且 不 再 读 人 更 多 输入 。 

初始 ，P' 将 状态 集合 Ro EAR, Ro 包含 的 任 一 状态 g HWE: 4 PAg 开始 并 且 栈 为 
Z, P 最终 将 会 接受 并 且 不 再 读 人 任何 输入 符号 。 那 么 已 开始 模拟 已 。 为 了 模拟 一 个 弹出 
转移 ，P 首先 弹出 并 抛弃 栈 顶 符号 所 代表 的 状态 集合 ， 接 下 来 P' 再 次 弹 栈 从 而 得 到 PP 在 
当前 应 该 弹出 的 符号 ， 并 根据 该 符号 判定 P 的 下 一 次 转移 。 模 拟 一 个 压 人 转移 6(gq,e，,e) 二 
(rz), PEARS qa 到 状态 > 的 过 程 中 压 人 x， 具体 操作 如 下 。 首 先 ，P' 检 查 栈 顶 的 状态 
集合 RR， 然 后 P' 压 入 x， 得 到 集合 S。S 满足 车 g EF 或 者 6(g,e,x) 二 (r,e) HrER, Mg 
ES。 换 句 话 说 ， 状 态 集合 S 要 么 立即 接受 ， 要么 在 弹出 xz 后 会 进入 R 中 的 一 个 状态 。 最 
后 ，P' 通 过 检查 栈 顶 集合 R 并 且 当 rER 时 进入 一 个 接受 状态 来 模拟 一 个 读 人 转移 6(9,a， 
es) 一 (r,e) 。 如 果 在 进入 这 个 状态 时 ，P 位 于 输入 字符 串 的 最 后 ， 那 么 已 会 接受 这 个 输入 。 
如 果 P' 不 是 在 输入 字符 串 的 最 后 ， 那 么 它 将 继续 模拟 PP， 那么 这 个 接受 状态 也 必定 会 记录 
P 的 状态 。 因 此 ， 我 们 创建 这 个 状态 作为 P 原始 状态 的 第 二 个 拷贝 ， 将 它 标 记 为 P' 的 一 


个 接受 状态 。 at 


2.4.2 确定 型 上 下 文 无 天 文法 


这 一 节 定 义 了 确定 型 上 下 文 无 关 文 法 ， 它 对 应 于 确定 型 下 推 自 动 机。 我 们 将 说 明知 把 
关注 限于 结束 标记 语言 (该 语言 中 所 有 字符 串 都 以 二 终止);， 则 这 两 个 模型 具有 等 价 的 能 
力 。 相 比 于 正则 表达 式 和 有 穷 自动 机 ， 或 者 CFG 和 PDA， 这 些 生 成 模型 和 识别 模型 在 不 
需要 结束 标记 的 情况 下 就 能 准确 描述 同一 类 语言 ， 因 此 确定 型 上 下 文 无 关 文 法 和 确定 型 下 
推 自动 机 之 间 的 对 应 关系 并 不 强大 。 然 而 ， 对 于 DPDA 和 DCFG， 结 束 标记 是 必需 的 ， 否 
则 等 价 关 系 就 不 再 成 立 。 

在 确定 型 自动 机 中 ， 计 算 过 程 的 每 一 步 决 定 了 下 一 步 。 自 动机 不 能 对 如 何 向 前 推进 做 
出 选择 ， 因 为 在 任何 节点 上 都 只 有 一 种 向 前 推进 的 可 能 性 。 为 了 用 文法 来 定义 确定 性 ， 观 
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被 约束 的 。 

CFG 中 的 派生 开始 于 起 始 变 元 ， 根 据 文 法 规则 得 到 一 系列 蔡 换 并 按 “ 目 项 回 下 ”的 
方式 推进 ， 直 至 派生 得 到 一 个 终结 符 串 。 为 了 定义 DCFG， 我 们 采用 “ 目 底 向 上 ”的 方 
式 ， 开 始 于 一 个 终结 符 串 ， 并 反 向 派生 ， 通 过 一 系列 归 约 步骤 (reduce step) 直至 得 到 起 
始 变 元 。 每 个 归 约 步骤 是 一 个 反 向 替换 ， 规 则 右边 的 终结 符 串 和 变 元 被 其 左边 的 相应 变 元 
所 替换 。 被 替换 的 串 称 为 归 约 串 (reducing string)。 我 们 将 整个 反问 派生 过 程 称 为 一 次 归 
约 (reduction). M% CFG 则 由 具备 确定 性 质 的 归 约 来 定义 。 

更 为 形式 化 地 ， 如 果 u 和 w 分 别 是 变 元 串 和 终结 符 串 ， 用 wu Pv RRA u 经 过 一 个 归 
约 步骤 得 到 v。 换 句 话 说 ，u Pv 与 之 含义 相同 。 一 个 从 u 到 v 的 归 约 (reduction from 
u to v) 是 一 个 序列 


我 们 称 x 可 归 约 (reducible) 到 v, 记 作 uv. +H v >u, 那么 uv. 一 个 从 U 开始 的 
归 约 (reduction from u) 表示 一 个 从 x 开始 至 起 始 变 元 的 归 约 。 在 一 个 最 左 归 约 Cleft- 
most reduction) 中 ， 每 一 个 归 约 串 只 在 其 他 所 有 归 约 串 完 全 在 其 左边 后 才 归 约 。 仔 细 想 
一 下 ， 可 以 看 出 最 左 归 约 即 是 反 回 的 最 右派 生 。 

这 里 可 以 看 出 CFG 确定 性 所 包含 的 思想 。 对 以 S 为 起 始 变 元 的 CFG， 串 ww 属于 其 语 
RA, w 的 最 左 归 约 为 : 

w=u, Hu: Heu, =S 

首先 ， 规 定 每 一 个 u; 决定 下 一 个 归 约 步骤 w+l。 因 此 也 决定 了 整个 最 左 归 约 。 这 个 规定 
只 是 表明 文法 是 无 歧义 的 。 为 了 得 到 确定 性 ， 我 们 还 需 更 进一步 。 对 每 一 个 u;， 其 下 一 个 
归 约 步骤 必须 由 u; 的 前 级 唯一 确定 ， 且 此 前 缀 从 头 开 始 并 且 包 含 了 归 约 步骤 中 的 归 约 串 
h, WAW, u 的 最 左 归 约 步骤 并 不 依赖 于 ui; 中 其 归 约 串 右 边 的 符号 。 

引信 术语 能 帮助 我 们 更 准确 地 描述 思路 。 令 w 是 属于 CFG 语言 G 的 一 个 字符 串 ， 令 
ui 出 现在 w 的 最 左 归 约 中 。 在 归 约 步骤 ww Hui, RAN Toh 被 反问 运用 。 这 意味 看 
可 以 记 作 wi 二 xzhy，wi+1 二 xTy， 其 中 BRIA, chu, 的 一 部 分 并 出 现在 h EM, y 
feu; 的 一 部 分 并 出 现在 h 右 侧 。 如 图 2- 17 所 示 。 


Pn. eee. EE Se eee ee eee 


Ws — S | ehi hy] one Vile I ori Ty, neey = uU 


图 2-17 zhy PzrTy 的 扩展 图 示 


我 们 将 h ME RIAA A Th RE ui 的 一 个 句柄 〈handle)。 换 句 话 说， 出 现在 
wEL(G) 最 左 归 约 中 的 串 wu; 的 一 个 句柄 是 w; 的 归 约 串 以 及 在 归 约 中 ; 的 归 约 规则 。 有 
些 情况 下 ， 当 不 需 关 注 归 约 规则 时 ， 句 柄 仅 指 代 归 约 串 。 称 在 L(G〉 中 某 字 符 串 的 最 左 归 
约 中 出 现 的 串 为 有 效 串 (valid string) 。 我 们 只 定义 有 效 串 的 句柄 。 

如 果 文 法 有 歧义 ， 一 个 有 效 串 可 能 有 多 个 句柄 。 无 歧义 的 文法 仅 由 一 个 语法 树 产生 字 
符 串 ， 因 此 ， 其 最 左 归 约 、 句 柄 都 是 唯一 的 。 在 这 种 情况 下 ， 称 为 有 效 串 的 唯一 句柄 。 

A ui 在 一 个 句柄 之 后 ， 观 察 ui 的 一 部 分 y。 因为 归 约 在 最 左边 ， 所 以 ¥ 总 是 一 个 终 
结 符 组 成 的 串 。 否 则 ，y 应 包含 一 个 变 元 符号 ， 且 该 变 元 符号 仅 从 前 一 个 归 约 步骤 中 产 
E, 该 归 约 步骤 的 归 约 串 完 全 位 于 的 右边 。 但是， 最 左 归 约 应 该 已 经 在 更 早 的 步骤 中 归 
约 了 句柄 。 


ZZF% LKFALAFARH 85 


考虑 文法 Gi : 
R~S|T 
S—aSb|ab 
T—aTbb|abb 
EWM ae BUC, 其 中 B=(a"™b™|m>1}, C={a"b’"|m>1}. EXAME aaabbbE€ L(G) 
的 最 左 归 约 中 ， 我 们 将 每 一 步 的 句柄 标注 了 下 划 线 : 
aaabbb PaaSbb PaSb PS HR 
相似 地 ， 串 aaabbbbbb 的 一 个 最 左 归 约 为 : 
aaabbbbbb PaaTbbbb PaTbbp TT PR 
在 这 两 个 例子 中 ， 所 展现 的 最 左 归 约 恰巧 是 唯一 可 能 的 归 约 ; 但 是 在 其 他 可 能 出 现 多 个 归 
约 的 文法 中 ， 我 们 必须 使 用 一 个 最 左 归 约 来 定义 句柄 。 注 意 ，aaabbb 和 aaabbbbbb 的 名 
柄 是 不 同 的 ， 尽 管 这 两 个 串 最 初始 的 部 分 一 致 。 接 下 来 我 们 将 会 在 定义 DCFG 时 简要 地 讨 
ix — AD 
一 台 PDA 通过 它 的 非 确 定性 来 识别 L(G1)， 从 而 猜测 它 的 输入 是 否 在 B PREC 
H., A, ECK a 的 句柄 压 人 栈 中 后 ， 它 弹出 a 的 句柄 并 且 将 每 一 个 与 b 或 者 bb 分别 
匹配 。 问 题 2.25 要 求证 明 L(G.) 不 是 一 个 DCFL。 如 果 尝 试 令 一 台 DPDA 识别 这 种 语 
言 ， 会 发 现 机 句 不 能 预先 知道 输入 是 否 在 如 中 或 在 C 中 ， 因 此 它 并 不 知道 如 何 将 a 的 句柄 
与 b 的 句柄 匹配 。 将 这 个 文法 与 文法 Go 比较 : 
R—1S|2T 
S—aSb|ab 
T—aTbb|abb 
Gz 中 第 一 个 输入 符号 提供 了 这 个 信息 。 我 们 对 DCFG 的 定义 必须 包含 G HER Go m 
令 Gs 为 如 下 文法 : 








S—>T- 
TTT) |e 
这 个 文法 前 明了 几 个 要 点 。 第 一 ， 它 产生 一 个 结束 标记 语言 。 稍 后 我 们 在 证 明 DPDA 和 
DCFG 的 等 价 性 时 ， 会 着 重 关 注 结 束 标记 语言 。 第 二 ，e 句柄 可 能 出 现在 归 约 中 ， 就 像 在 
串 OO4 的 最 左 归 约 中 短 下 划 线 表示 的 那样 : 
OO4 BTOO4 FTCT)OTH BTO4 FTCT) FT BS € 
因为 句柄 决定 归 约 ， 所 以 在 定义 DCFG 的 过 程 中 句柄 扮演 着 重要 的 角色 。 一 有 旦 我 们 知 
道 一 个 串 的 句柄 ， 我 们 就 知道 了 下 一 个 归 约 步骤 。 为 了 使 接 下 来 的 定义 有 意义 ， 牢 记 我 们 
的 目标 : 我 们 力图 定义 DCFG 使 得 它 可 以 与 DPDA 相对 应 。 我 们 通过 展示 如 何 将 DCFG 
转换 成 等 价 的 DPDA 来 建立 这 个 对 应 关系 ， 反 之 亦 然 。 为 了 使 这 个 转换 有 效 ，DPDA 需 
要 寻找 句柄 ， 从 而 寻找 到 归 约 。 但 是 找到 一 个 句柄 可 能 有 技巧 性 。 看 起 来 我 们 需要 知道 一 
个 串 的 下 一 个 归 约 步骤 从 而 识别 它 的 句柄 ， 但 是 DPDA 不 需要 预先 知道 归 约 。 我 们 通过 限 
制 在 DCFG 中 的 句柄 来 解决 这 个 问题 ， 从 而 使 得 DPDA 能 够 更 为 容易 地 找到 句柄 。 
为 了 更 好 地 说 明定 义 ， 考 虑 某 些 串 有 多 个 句柄 的 歧义 性 文法 。 选 择 一 个 特定 的 句柄 可 
能 需要 预先 知道 哪 棵 语法 树 派 生 了 这 个 串 ， 以 及 那些 对 于 DPDA 一 定 是 无 法 获得 的 信息 。 
我 们 发 现 DCFG 是 非 歧 义 性 的 ， 因 此 句柄 是 独一无二 的 。 然 而 ， 只 有 独一无二 的 句柄 对 和 定 
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X DCFG 来 说 是 不 够 的 ， 就 如 同文 法 Cl 在 例 2. 28 中 展示 的 那样 。 

为 什么 拥有 独一无二 的 句柄 不 能 说 明 我 们 有 一 个 DCFG? 检查 G1 中 的 句柄 能 明显 地 
看 到 答案 。 如 果 wEB, WAWE ab; 然而 如 果 wEC， 则 句柄 是 abb。 虽 然 双 决定 了 会 
出 现 哪 种 情况 ， 但 是 确定 句柄 为 ab 还 是 abb 还 需要 检查 所 有 的 ww， 并且 当 一 台 DPDA 需 
要 选择 句柄 的 时 候 ， 它 还 没有 读 完 整个 输入 。 

为 了 定义 对 应 于 DPDA 的 DCFG ， 我 们 对 句柄 施加 一 个 更 为 严格 的 要 求 。 一 个 有 效 虽 
的 初始 部 分 〈 从 头 开 始 并 包括 它 的 句柄 ) 必须 足以 决定 句柄 。 因 此 ， 如 采 我 们 在 从 左 到 右 
读 和 人 一 个 有 效 串 时 ， 只 要 读 入 句柄 就 可 以 知道 我 们 获得 了 它 。 为 识别 句柄 ， 我 们 不 需要 读 
入 该 句柄 之 外 的 东西 。 回 忆 一 下 一 个 有 效 串 的 未 读 部 分 只 包括 终结 符 ， 因 为 这 个 有 效 串 已 
经 通过 一 个 初始 终结 符 串 的 一 个 最 左 归 约 得 到 了 ， 而 未 读 的 部 分 还 没有 处 理 。 因 此 ， 在 每 
一 个 有 效 串 zhy(yE3* ) 中 是 独一无二 的 句柄 时 ， 我 们 说 h 是 有 效 串 v= 二 xhy 的 一 个 强 
AA (forced handle). | 

确定 型 上 下 文 无 关 文 法 (deterministic context-free grammar) 是 能 够 让 
每 一 个 有 效 串 都 有 一 个 强制 句柄 的 上 下 文 无 关 文 法 。 

为 了 简洁 ， 我 们 假定 在 整个 关于 确定 型 上 下 文 无 关 文 法 的 部 分 中 ，CFG 的 起 始 变 元 
不 出 现在 任何 规则 的 右边 ， 在 文法 中 每 一 个 变 元 出 现在 该 文法 语言 的 某 个 串 的 一 个 归 约 
中 ， 即 文法 不 包含 无 用 的 变 元 。 

虽然 我 们 关于 DCFG 的 定义 在 数学 上 是 很 精确 的 ,但 是 它 并 不 能 提供 任何 明确 的 方式 
去 判定 一 个 CFG 是 否 是 确定 性 的 。 下 一 步 我 们 将 会 给 出 一 个 准确 实现 这 个 目的 的 过 程 ， 
称 之 为 DK- 测 试 。 当 我 们 展示 如 何 将 DCFG 转换 成 DPDA 时 ， 我 们 也 将 使 用 DK- 测 试 的 
构造 方法 使 得 DPDA 可 以 发 现 句 柄 。 

DK- 测 试 依赖 于 一 个 简单 但 令 人 惊讶 的 事实 。 对 任意 CFG G 我 们 能 够 构造 一 个 可 以 
识别 句柄 的 关联 DFA DK。 特 别 地 ， 如 果 满 足以 下 条 件 ，DK 接受 它 的 输入 z: 

l. z 是 某 个 有 效 串 v= 二 zy 的 前 级 ; 

2. z 以 的 一 个 句柄 作为 结束 。 

此 外 ，DK 的 每 一 个 接受 状态 表明 (一 组 ) 相关 联 的 归 约 规则 。 在 一 个 一 般 性 的 CFG H, 
根据 扩展 zx 的 有 效 v， 可 能 会 运用 多 个 归 约 规则 。 但 是 在 一 个 DCFG 中 ， 如 我 们 看 到 的 那 
样 ， 每 一 个 接受 状态 对 应 于 一 个 确定 的 归 约 规则 。 

在 形式 化 提出 DK 并 列举 它 的 性 质 之 后 ， 我 们 会 描述 DK- 测 试 。 计 划 是 这 样 的， 在 一 个 
DCFG 中 ， 所 有 的 句柄 都 是 强制 的 。 因 此 如 果 zy 是 一 个 以 z 为 前 缀 并且 以 zy 的 一 个 句柄 为 
结尾 的 有 效 串 ， 那 么 这 个 句柄 是 独一无二 的 ， 且 它 也 是 所 有 有 效 串 zy 的 句柄 。 基 于 这 些 性 
质 ， 每 一 个 DK 的 接受 状态 一 定 与 某 个 单一 句柄 相关 联 ， 因 此 与 某 个 实际 的 归 约 规则 相关 
联 。 此 外 ， 接 受 状 态 必 须 不 能 拥有 一 个 回 外 的 路 径 ， 该 路 径 在 读 和 人 3* 中 的 一 个 串 之 后 可 以 
得 到 一 个 接受 状态 。 否 则 ，zy 的 句柄 不 会 是 独一无二 的 或 者 句柄 会 依赖 于 y。 在 DK- 测 试 
中 ， 我 们 构造 DK， 如 果 所 有 G 的 接受 状态 都 有 这 些 性 质 ， 则 推断 出 G 是 确定 性 的 。 

为 了 构造 DFA DK， 我 们 将 会 构造 一 个 等 价 的 NFA K， 通 过 在 定理 1. 19 中 介绍 的 子 
集 构造 将 K 转换 成 DKS 。 为 了 理解 K， 首 先 考虑 一 个 能 完成 更 简单 任务 的 NFA J。 它 接 


© AFT DK 是 对 “确定 性 K” (deterministic K) 的 简化 ， 同 时 DK 也 代表 最 早 提 出 这 个 思路 的 人 Donald Knuth, 
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受 每 一 个 以 任何 规则 的 右边 作为 结束 的 输入 串 。 构 造 J AR. J 会 猜测 哪个 规则 适 
用 ， 也 能 猜测 从 何 处 开始 将 输入 与 规则 的 右边 相 匹 配 。 随 着 匹配 输入 ，J 通 过 已 经 选 好 的 
规则 右边 来 追踪 它 的 进程 。 我 们 用 在 这 个 规则 的 对 应 位 置 放置 句点 的 方式 来 表示 这 个 进 
程 ， 称 其 为 加 点 规则 (dotted rule) ， 在 其 他 一 些 资料 中 也 称 作 项 (item)。 因 此 对 每 个 在 
右边 有 上 & 个 符号 的 规则 Buus ur, REE & 十 1 个 加 点 规则 : 

B—>. uj ZL2。ZL 


Bu). us "uy 


Bou tio ***. Us 


Bou, U2 *** 2h 


每 一 个 加 点 规则 都 对 应 于 J 的 一 个 状态 。 我 们 用 一 个 方 框 [B->v.v ] 来 表示 状态 和 相关 联 
的 加 点 规则 B—u. uv。 接受 状态 (Bu. 对 应 于 完整 规则 (completed rule)， 即 以 句点 作 
为 结束 。 对 每 一 个 规则 Bu, RA [B->.v] 添 加 一 个 单独 的 由 所 有 符号 的 自 循环 构成 的 
起 始 状态 以 及 一 个 se- 转移 。 因 此 如 果 在 输入 的 最 后 成 功 完成 匹配 ， 那 么 J 接受。 如 果 出 现 
一 个 错误 的 匹配 或 者 最 后 的 匹配 没有 正好 出 现在 输入 的 末尾 ， 那 么 本 的 这 个 计算 分 支 会 
拒绝 。 

NFA K 以 相似 但 更 为 简捷 的 操作 选择 匹配 规则 。 只 有 可 能 的 归 约 规则 才 会 被 允许 。 
如 同 J]， 它 的 状态 对 应 于 所 有 的 加 点 规则 。 它 有 一 个 特殊 的 起 始 状态 ， 该 状态 对 所 有 包含 
起 始 变 元 Si 的 规则 来 说 ， 都 有 到 Sim. 4 的 e- 转 移 。 在 其 每 一 个 计算 分 支 中 ，K 将 一 个 
可 能 的 归 约 规则 与 输入 的 某 个 子 串 相 匹配 。 如 果 规 则 的 右边 包含 变 元 ，K 会 不 确定 性 地 转 
到 某 个 扩展 该 变 元 的 规则 。 引 理 2. 31 形式 化 地 展现 了 该 思路 。 我 们 首先 详细 地 描述 K. 

转换 过 程 在 两 种 情况 下 出 现 ， 移动 转移 (shift-move) 和 上 转移。 对 每 一 个 终结 符 或 
者 变 元 a 会 出 现 移动 转移 ， 对 每 个 规则 B>uav 有 


(Bu. av)}— B>ua.v)] 
对 所 有 规则 BuCv 和 C->r 会 出 现 e- 转 移 : 

Bu. Co)—>» (C>. 
接受 状态 是 所 有 对 应 于 一 个 完整 规则 的 (Bou. | 。 接 受 状态 没有 向 外 的 转换 并 且 写 成 两 个 
方 框 的 形式 。 

下 一 个 引 理 以 及 它 的 推论 证 明了 K 接受 所 有 以 串 z 的 某 个 有 效 扩展 的 句柄 作为 结束 的 
串 z。 因 为 K 是 非 确定 性 的 ， 所 以 我 们 说 它 “ 可 能 ”进入 一 个 状态 来 表示 K 进入 了 它 的 
非 确定 型 的 某 些 分 支 上 的 状态 。 

EE 在 输入 < 上 K 可 能 进入 状态 [>u.v] 当 且 仅 当 对 某 些 yE3* ，z 一 z 
E ruvy 是 一 个 句柄 为 uv、 归 约 规则 为 T>uv 的 有 效 串 。 

证 明 思路 ”K 通过 将 一 个 选 定 的 规则 的 右边 与 输入 的 一 部 分 进行 匹配 来 完成 操作 。 如 
果 完 全 匹配 ，K 接受 。 如 果 规 则 的 右边 包含 变 元 C， 则 可 能 出 现 两 种 情况 。 如 果 下 一 个 输 
入 符号 是 C， 那 么 继续 匹配 选 定 的 规则 。 如 果 C 已 经 被 扩展 了 ， 输 入 会 包含 由 C 派 生出 的 
符号 ， 所 以 K 非 确定 性 地 为 C 选择 一 个 替换 规则 ， 并 从 这 个 规则 右边 的 起 始 位 置 开 始 匹 
配 。 若 当前 选 定 规则 的 右边 已 经 完成 匹配 ， 则 K 接受 。 
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证 明 ”首先 我 们 证 明 充 分 性 。 假 定 在 w 上 的 K 进入 (Tou. v0), MK 的 起 始 状 态 一 直 
到 [T>u.v ] 检 查 K 的 路 径 。 想 象 该 路 径 如 同 被 = 转移 间隔 的 移动 转移 的 执行 过 程 。 移 动 
转移 是 共享 相同 规则 的 状态 间 的 转移 ， 从 读 人 符号 向 右 移动 句点 的 位 置 。 在 第 i 次 执行 
时 ， 规 则 为 Si->wiSitiu， 此 处 Si+1 为 下 一 次 执行 中 要 扩展 的 变 元 。 倒 数 第 二 次 执行 的 规 
则 是 Sı >uiT Vis 最 后 一 次 执行 的 规则 是 {Wa 

输入 必须 与 wiu2…uiu =ru EFA, RAE u: Mu 是 从 输入 中 读 入 的 移动 转移 符 
BAD y= 二 vw.…vzv1， 我 们 发 现 zuvy 可 以 从 G 中 派生 出 来 ， 因 为 上 述 规则 给 出 的 派生 过 
程 就 如 同 图 2- 18 中 语法 树 所 展示 的 一 样 。 

为 了 得 到 一 个 有 效 串 ， 对 y 中 出 现 的 所 有 变 元 进行 完全 扩展 直到 每 一 个 变 元 派生 出 某 
个 终结 符 串 ， 将 其 称 为 结果 串 ye P zuvy 是 有 效 的 ， 因 为 它 出 现在 wEL(G) 的 一 个 最 左 
归 约 中 ， 即 通过 完全 扩展 zuvy 中 的 全 部 变 元 得 到 的 一 个 终结 符 串 。 

正如 图 2- 19 所 示 ，uv 是 归 约 中 的 句柄 ， 且 它 的 归 约 规则 是 Tour, 
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上 u v S i u F y 
图 2-18 派生 zuvy 的 语法 树 图 2- 19 派生 带 有 句柄 uv 的 有 效 串 zuvy 的 语法 树 


现在 我 们 证 明 引 理 的 必要 性 。 假 定 串 zuvy 是 一 个 带 有 句柄 uv 且 归 约 规则 为 工 -xz 
的 有 效 串 。 证 明 K 在 输入 zu 上 可 能 进入 状态 Mu v). 

zuvy 的 语法 树 出 现在 上 面 的 图 中 。 该 语法 树 以 起 始 变 元 S 为 根 节点 ， 且 一 定 包含 变 
元 T， 因 为 T>uv 是 zuvy 归 约 过 程 的 第 一 步 。 令 S; ，…，S, 为 如 图 所 示 的 从 Si AT H 
路 径 上 的 变 元 。 注 意 ， 在 语法 树 上 出 现在 该 路 径 左 侧 的 所 有 变 元 都 是 未 扩展 的 ， 否 则 uv 
不 会 是 句柄 。 

在 这 棵 语法 树 上 ， 根据 规则 Se Puit 每 一 个 Si 推导 出 Opi o A He X E Ui 和 Ui 
来 说 ， 文 法 一 定 包含 下 面 的 规则 。 

Si—> u S2 v 


Sz 一 > M2 S3 U2 


9 一 > 2 了 也/ 


T— uv 
ERAMA z= 二 xu 时 ，K 包含 下 述 从 它 的 起 始 状态 到 状态 Tou ] 的 路 径 。 首 先 ， 
K 执行 一 个 e- 转 移 到 [Si 一 . Sou), F-#, YA ui 的 符号 ，K 执行 对 应 的 移动 转移 
直到 其 在 ui 的 结尾 进入 [S1 习 uu. Sou), BERK 执行 一 个 e- 转 移 到 (Sz 一 . uz S3vz]， 在 读 
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A uz 后 执行 移动 转移 直到 其 达到 [Suz. Ss3v2z]， 以 此 类 推 。 在 读 入 uz K 进入 
(Siu. Tu ]， 通 过 一 个 。 转 移 到 [了 >. wv]， 并 最 终 在 读 人 u 之 后 进入 (T>uv)。 = 

下 面 的 推论 说 明了 K 接受 所 有 以 某 个 有 效 扩展 得 到 的 一 个 句柄 为 结尾 的 串 。 当 u=h, 
v=e 时 ， 可 由 引 理 2. 31 得 到 该 推论 。 w 


在 输入 z EK 可 能 进入 接受 状态 当 且 仅 当 z=rh Hh 是 遵循 
归 约 规则 Th 的 有 效 串 rhy 的 一 个 句柄 。 

最 后 ， 我 们 通过 使 用 定理 1. 19 证 明 中 构造 的 子 集 ， 并 删除 所 有 从 起 始 状 态 无 法 达到 
的 状态 ， 将 NFA K 转换 成 DFA DK, 每 一 个 DK 的 状态 包含 一 个 或 多 个 加 点 规则 。 每 一 
个 接受 状态 包含 至 少 一 个 完整 规则 。 通 过 指 代 包含 加 点 规则 的 状态 ， 可 以 将 引 理 2. 31 和 
推论 2.32 应 用 于 DK. 

现在 我 们 做 好 了 描述 DK- 测 试 的 准备 。 

从 一 个 CFG G 开始 ， 构 造 关 联 的 DFA DK 。 通 过 检查 DK 的 接受 状态 ， 判 定 G 是 否 
是 确定 性 的 。DK- 测 试 保证 每 一 个 接受 状态 包含 : 

1. 有 且 仅 有 一 个 完整 的 规则 ， 

2. 在 所 有 加 点 规则 中 句点 不 会 紧 跟 一 个 终结 符 ， 即 对 aE€5， 没 有 形 如 Bu. av 的 加 
点 规则 。 

G 通过 DK- 测 试 当 且 仅 当 G 是 一 个 DCFG。 

证 明 思 路 ”我 们 会 展示 DK- 测 试 通过 当 且 仅 当 所 有 的 句柄 是 强制 的 。 等 价 地 ， 测 试 失 
败 当 且 仅 当 某 个 句柄 不 是 强制 的 。 首 先 ， 假 定 某 个 有 效 串 有 一 个 非 强 制 的 句柄 。 如 果 我 们 
在 这 个 串 上 运行 DK, HEI 2.32 说 明 DK 在 句柄 的 结尾 进入 一 个 接受 状态 。 因 为 接受 状 
态 有 男 一 个 完整 的 规则 或 者 有 一 个 以 终结 符 开始 到 达 接 受 状态 的 向 外 路 径 ， 所 以 DK- 测 试 
是 失败 的 。 在 后 一 种 情况 中 ， 接 受 状 态 会 包含 一 个 加 点 规则 ， 在 该 规则 中 一 个 终结 符 出 现 
在 句点 之 后 。 

反 过 来 ， 如 果 DK- 测 试 失 败 是 因为 一 个 接受 状态 有 两 个 完整 的 规则 ， 在 这 种 情况 下 相 
关联 的 串 被 扩展 成 带 有 不 同 句 柄 的 两 个 有 效 串 。 相 似 地 ， 如 果 接 受 状 态 有 一 个 完整 的 规则 
和 一 个 加 点 规则 ， 在 这 个 加 点 规则 中 ， 终 结 符 在 句点 之 后 ， 那 么 应 用 引 理 2. 31 能 得 到 带 
有 不 同 句 柄 的 两 个 有 效 的 扩展 。 构 造 对 应 于 第 二 个 规则 的 有 效 扩 展 有 些 棘手 。 

证 明 首先 来 看 充分 性 。 假 定 G 不 是 确定 性 的 ,证明 G 不 能 通过 DK- 测 试 。 使 用 有 
一 个 非 强 制 句 柄 疡 的 有 效 串 chy, AERA RR chy 有 一 个 不 同 的 句柄 及 了 关 h， 这 里 y 
是 一 个 终结 符 串 。 我 们 可 以 将 chy 写成 Xxhy' = 二 zxhy。 

如 果 zh 二 xh， 那 么 归 约 规则 是 不 同 的 ， 因 为 h AA 是 不 相同 的 句柄 。 因 此 ， 输 入 xh 
将 DK 传送 给 包含 两 个 完整 规则 的 某 个 状态 ,违背 了 DK- 测试 。 

如 果 zh 了 关 xzh， 其 中 一 个 扩展 另 一 个 。 假 定 rh 是 xh HAR. WR zh 是 更 短 的 串 ， 
用 y 代替 y ， 该 论证 和 串 的 互 换 相 同 。 令 g 为 DK 在 输入 zh 上 进入 的 状态 。 状 态 g 一定 
是 接受 的 ， 因 为 h 是 zxhy 的 一 个 句柄 。 必 有 一 个 从 g 出 发 的 转移 箭头 ， 因 为 xh 通过 g 将 
DK 传送 给 一 个 接受 状态 。 另 外 ， 因 为 yE3+ ， 这 个 转移 箭头 被 一 个 终结 符 所 标注 。 这 
里 ye 是 因为 zh 扩展 了 zh。 因 此 g 包含 一 个 加 点 规则 ， 在 这 个 规则 中 一 个 终结 符 紧 跟 
在 句点 之 后 ， 这 违背 了 DK- 测试 。 

为 了 证 明 必 要 性 ， 假 定 G 在 某 个 接受 状态 9 不 能 通过 DK- 测试 ， 通 过 展示 一 个 非 强制 
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的 句柄 来 说 明 G 不 是 确定 性 的 。 因 为 g 是 接受 的 ， 它 有 一 个 完整 的 规则 Toh... $ z E 
个 可 以 将 DK 推导 至 g 的 串 。 那 么 对 yE3* ， 有 zx 二 Xxh， 这 里 有 效 串 chy 有 融 归 约 规则 
Th 的 句柄 hh。 现 在 根据 DK- 测 试 失 败 的 方式 ， 考 虑 两 种 情况 。 

首先 ， 认 为 g 有 另 一 个 完整 的 规则 Boh... PARRA chy 必定 有 一 个 带 有 归 约 
规则 Bh 的 不 同 句柄 产 。 因 此 , 天 不 是 一 个 强制 句柄 。 

其 次 ， 认 为 g 包含 一 个 规则 B 一 u.av， 这 里 aoE 三 。 因 为 zh 将 DK 传送 给 gag， 得 到 
zj 一 ZU， 这 里 对 yeC>d*, ruavy 是 有 效 的 ， 且 有 一 个 带 有 归 约 规则 B 一 wav 的 句柄 uav. 
为 了 说 明 h 是 非 强制 的 ， 完 全 扩展 v 中 所 有 变 元 得 到 结果 w ED, RAA y Savy, È 
意 y E353* 。 下 面 的 最 左 归 约 说 明了 chy 是 一 个 有 效 串 而 h 不 是 句柄 。 

rhy =xhav y=xuav y Druavy DrBy DS 

这 里 S 是 起 始 变 元 。 我 们 知道 zuavy 是 有 效 的 并 且 通 过 使 用 一 个 最 右派 生 能 够 得 到 
zuav y， 所 以 zuav'y 也 是 有 效 的 。 此 外 ，zauav y 的 句柄 要 么 位 于 v 中 (如 果 vA) 要 
么 就 是 uav (WR v= 二 v )。 任 一 情况 下 ， 句 柄 包括 a 或 者 在 a 之 后 ， 而 不 能 是 hh， 因 为 h 
全 部 在 a 之 前 。 因 此 产 不 是 一 个 强制 句柄 。 a 

当 在 实际 中 建立 DFA DK 时 ， 直 接 构造 会 比 事先 构造 NFA K 更 快 。 首 先 在 包含 起 始 
变 元 的 所 有 规则 的 初始 位 置 加 点 ， 并 且 把 这 些 新 加 点 规则 放 和 DK 的 起 始 状态 。 如 果 在 任 
一 规则 中 某 个 句点 出 现在 变 元 C 之 前 ， 将 句点 置 于 所 有 在 左边 有 的 规则 的 初始 位 置 ， 并 
在 状态 中 添加 这 些 规 则 ， 继 续 这 个 过 程 直 到 不 能 得 到 新 的 加 点 规则 。 对 出 现在 句点 之 后 的 任 
一 符号 c， 添 加 一 条 标记 为 c 的 边 指 回 一 个 新 状态 ， 该 状态 包含 对 所 有 c 之 前 的 加 点 规则 ， 移 
动 句点 在 c 中 位 置 得 到 的 加 点 规则 ， 并 且 添 加 规则 来 对 应 句点 出 现在 变 元 之 前 时 的 规则 。 

这 里 我 们 说 明 DK- 测 试 对 下 面 的 文法 是 如 何 失败 的 〈 见 图 2- 20) 。 

S—>E-J 
E>E+T | T 
T—~TXala 





图 2-20 一 个 失败 的 DPK- 测试 例子 


注意 左下 侧 和 右上 侧 第 二 个 这 两 个 有 问题 的 状态 。 这 两 个 状态 中 都 有 一 个 接受 状态 包 
含 一 条 加 点 规则 ， 并 且 在 加 点 规则 中 一 个 终结 符 出 现在 句点 之 后 。 s 
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一 个 说 明 下 面 文法 是 DCFG AY DFA DK (WAI 2-21). 


S+T- 
T—>T(T) le 
观察 发 现 所 有 的 接受 状态 都 满足 DK- 测 试 的 条 
件 。 a 


2.4.3 DPDA 和 DCFG 的 关系 


本 小 节 中 我 们 将 会 证 明 DPDA 和 DCFG 描述 相 
同 的 结束 标记 语言 类 。 首 先 ， 我 们 将 说 明 如 何 将 
DCFG 转换 成 等 价 的 DPDA。 这 个 转换 在 所 有 情况 下 图 2- 21 一 个 通过 DK- 测 试 的 例子 
都 能 进行 。 接 着 ,我们 将 说 明 如 何 实现 从 DPDA 到 等 价 的 DCFG 的 反 向 转换 。 该 转换 只 
在 结束 标记 语言 中 才能 进行 。 我 们 将 等 价 性 限定 于 结束 标记 语言 ， 否 则 模型 不 等 价 。 我 们 
已 经 证 明了 结束 标记 不 会 影响 DPDA 可 以 识别 的 语言 类 ,但 是 它们 会 影响 DCFG 产生 的 
语言 类 。 没 有 结束 标记 ，DCFG 只 产生 DCFL 的 一 个 子 类 一 一 它们 都 是 前 缀 无 关 的 ( 见 问 
题 2. 22) 。 注 意 所 有 的 结束 标记 语言 都 是 前 级 无 关 的 。 

P ”一 个 结束 标记 语言 由 一 个 确定 型 上 下 文 无 关 文 法 产生 ， 当 上 且 仅 当 它 是 确 
定型 上 下 文 无 关 的 。 

我 们 需要 证 明 充 分 性 和 必要 性 。 首 先 我 们 会 说 明 每 一 个 DCFG 有 一 个 等 价 的 DPDA。 

接 下 来 我 们 会 说 明 每 一 个 能 识别 结束 标记 语言 的 DPDA 都 有 一 个 等 价 的 DCFG。 我 们 用 不 
同 的 引 理 来 证 明 充 分 性 和 必要 性 。 
eee 每 一 个 DCFG 都 有 一 个 等 价 的 DPDA。 
证 明 思 路 ”我们 说 明 如 何 将 DCFG G 转换 成 一 个 等 价 的 DPDA P. P 按 如 下 所 述 使 用 
DFA DK 进行 操作 。 对 于 从 输入 中 所 读 取 的 符号 ， 它 模拟 DK 直至 DK 接受 。 如 定理 
2. 33 的 证 明 所 述 ，DK 的 接受 状态 指明 一 个 特定 的 加 点 规则 ， 因 为 G 是 确定 型 的 ， 并 且 这 
个 规则 为 扩展 了 目前 已 知 输入 的 有 效 串 确定 一 个 句柄 。 此 外 ， 因 为 G 是 确定 型 的 ， 这 个 句 
柄 适用 于 每 一 个 有 效 扩 展 ， 特 别 地 ， 如 果 输 入 属于 工 (G) ， 那 么 这 个 句柄 适用 于 对 P 的 全 
部 输入 。 所 以 书 能 使 用 这 个 句柄 为 它 的 输入 串 确 定 第 一 个 归 约 步 又， 尽管 在 此 时 它 只 是 读 
入 了 它 输入 的 一 部 分 。 

P 如 何 确 定 第 二 个 和 接 下 来 的 归 约 步骤 ? 一 个 思路 是 在 输入 串 上 直接 执行 归 约 步骤 ， 
然后 通过 DK 运行 修改 后 的 输入 ， 就 如 同 我 们 之 前 做 的 那样 。 但 是 输入 不 能 修改 或 者 重新 
谈 入 ， 因 此 这 个 思路 行 不 通 。 另 一 个 思路 是 将 输入 拷贝 到 栈 并 在 栈 上 执行 归 约 步骤 ， 但 是 
这 样 的 话 P 必须 弹出 整个 栈 来 通过 DK 运行 修改 后 的 输入 ， 因 此 修改 后 的 输入 对 后 面 的 步 
又 就 不 能 持续 有 效 了 。 

这 里 有 一 个 小 技巧 ， 就 是 在 栈 里 存储 所 有 的 DK 的 状态 ， 而 不 是 存储 输入 串 。 每 当 P 
读 人 一 个 输入 符号 并 模拟 一 个 在 DK 中 的 转移 时 ， 它 通过 将 其 压 人 栈 来 记录 DK 的 状态 。 
当 其 使 用 归 约 规则 To 来 执行 一 个 归 约 步骤 时 ， 它 从 栈 中 弹出 |x| 个 状态 ， 展 现在 读 入 z 
之 前 DK 的 状态 。 它 将 DK 重 置 为 该 状态 ， 接 下 来 在 输入 工 上 模拟 DK ， 并 将 产生 的 状态 
EAR. Zi 己 像 之 前 读 取 和 处 理 输入 符号 那样 继续 进行 。 

x P 将 起 始 变 元 压 和 人 栈 时 ， 它 已 经 找到 一 个 输入 到 起 始 变 元 的 归 约 ， 所 以 它 进 入 一 个 











接受 状态 。 a 

接 下 来 我 们 证 明定 理 2. 36 的 必要 性 。 

每 一 个 能 识别 结束 标记 语言 的 DPDA 都 有 一 个 等 价 的 DCFG， 

证 明 思 路 ”这 个 证 明 是 对 引 理 2. 15 中 将 PDA P 转换 为 等 价 CFG G 的 构造 过 程 的 修 
改 。 这 里 P 了 和 G 是 确定 型 的 ， 在 引 理 2. 15 的 证 明 思 路 中 ， 我 们 改变 已 来 清空 它 的 栈 ， 
并 且 当 书 接 受 时 进入 一 个 指定 的 接受 状态 qt。 一 个 PDA 不 能 直接 判定 其 在 输入 末尾 
是 什么 ， 所 以 了 使 用 它 的 非 确 定性 来 猜测 其 会 处 于 哪 种 情况 。 我 们 不 希望 在 构造 DPDA 
P 的 过 程 中 引入 非 确 定性 。 替 代 策 略 是 使 用 一 个 假设 ,假设 LL(P) 是 结束 标记 的 。 我 们 
修改 PP 来 清空 它 的 栈 ， 并 且 在 它 已 经 读 入 结束 标记 -十 之 后 进入 原 接受 状态 之 一 时 进 
A Qus e 

接 下 来 我 们 应 用 文法 构造 得 到 G。 简 单 地 应 用 原始 构造 于 DPDA 可 以 产生 一 个 近乎 确 
定型 文法 ， 这 是 因为 CFG 的 派生 密切 对 应 于 DPDA 的 计算 过 程 。 该 文法 在 次 要 的 、 可 修 
复 的 方式 下 不 是 确定 型 。 

原始 构造 引入 了 形 如 Ay 一 Ap A 的 规则 ， 它 们 可 能 会 引起 卜 义 。 这 些 规则 包括 的 情 
FEA: Am 产生 一 个 串 ， 该 串 将 PARS p 带 到 状态 qg， 在 每 个 状态 的 结尾 栈 都 被 清空 ， 
以 及 在 中 途 栈 被 清空 。 蔡 换 操 作对 应 于 在 一 处 将 计算 分 拆 。 但 是 如 果 栈 多 次 清空 ， 那 么 会 
出 现 多 个 分 拆 。 每 个 分 拆 会 产生 不 同 的 语法 树 ， 所 以 产生 的 文法 是 歧义 性 的 。 通 过 修改 文 
法 使 得 计算 分 拆 只 在 栈 清空 的 最 后 位 置 发 生 ， 可 以 消除 歧义 。 用 一 个 出 现在 歧义 性 文法 中 
的 简单 但 类 似 的 情况 来 说 明 . 

S>T- 
T—TT|(T) le 
该 文法 等 价 于 非 歧 义 性 的 、 确 定型 的 文法 
S>T- 
T—T(T)|e 

接 下 来 我 们 通过 使 用 DK- 测 试 来 说 明 修 改 后 的 文法 是 确定 型 的 。 文 法 被 设计 成 模拟 
DPDA 。 就 像 引 理 2. 15 的 证 明 一 样 ， 在 P 从 一 个 空 栈 上 的 状态 p 运行 到 一 个 空 栈 上 的 状 
态 g 的 过 程 中 Ay 产生 这 些 串 。 我 们 将 会 使 用 P 的 确定 性 来 证 明 G 的 确定 性 ， 这 样 我 们 会 
EM P 的 确定 性 对 于 定义 P 在 有 效 串 上 的 计算 过 程 从 而 来 观测 它 在 句柄 上 的 行为 是 很 有 
用 的 。 然 后 我 们 可 以 使 用 P 的 确定 型 行为 来 说 明 句 柄 都 是 强制 的 。 

证 明 UH P=, ZTS > dace) 并 构造 C。 起 始 变 元 是 As ,。 
省 如 下 3 不 部 分 。 

1. 对 每 一 个 p,qyr;5EQ,uET， 以 及 a,bE3。， 如 果 6C(p,aye) 包含 (rou) 且 6(s,b， 
u) 包 含 (g,e)， 那 么 将 规则 A 一 aAnb MAG. 

2. 对 每 一 个 p,q,rE Q， 将 规则 Ajp 一 ApyAn 放 入 G。 

3. 对 每 一 个 pEQ， 将 规则 App 一 e MAG. 

为 避免 引入 歧义 我 们 对 构造 过 程 作 修改 : 将 类 型 1 和 类 型 2 规则 合并 成 一 个 实现 相同 
效果 的 单一 类 型 1-2 规则 。 

1- 2. 对 每 一 个 prqorss t€ Quel, WRa,dE>d., WH 6(r,a,e) 二 (s,u) 且 6(1,b， 
u) 二 (gq,e)， 将 规则 App >ApaAsh BRAG. 


o HENEN 


acce 


22% LFXLAFKRH 93 


为 了 看 到 修改 后 的 文法 产生 相同 的 语言 ， 考 虑 原始 文法 的 任 一 派生 。 对 每 一 个 由 类 型 2 
规则 Am 一 AmwAn 导 致 的 蔡 换 ， 我 们 可 以 假定 > 是 卫 在 栈 变 为 空 的 过 程 中 〈 修 改 断 言 2. 17 的 
证 明 过 程 来 选择 r) 最 右 位 置 时 的 状态 。 那 么 Aw 随 后 的 替换 一 定 是 用 类 型 1 规则 Ag caA。2 
来 扩展 它 的 。 我 们 可 以 将 这 两 个 替换 合并 成 一 个 单一 类 型 1-2 规则 Am 一 AraAvp。 

相反 ， 在 一 个 使 用 修改 后 文法 的 派生 中 ， 如 果 用 类 型 2 规则 Am 一 AwAnm 和 紧 跟着 的 
类 型 1 规则 A,s aAab 来 代替 类 型 1-2 规则 Apg 一 ApraA sb， 可 以 得 到 相同 的 结果 。 

现在 我 们 用 DK- 测 试 来 证 明 G 是 确定 型 的 。 为 了 实现 这 一 点 ， 我 们 将 会 通过 扩展 P 
的 输入 字母 表 和 和 转移 函数 来 处 理 除 终结 符 之 外 的 变 元 符号 ， 从 而 分 析 在 有 效 串 上 P 如何 操 
作 。 我 们 把 所 有 的 符号 A 添加 到 PP 的 输入 字母 表 并 通过 定义 6(p,Ap e)=(qre) 来 扩展 
它 的 转移 函数 6。 令 所 有 其 他 的 转移 包括 Ayy 为 B。 为 了 保持 P 的 确定 性 行为 ， 如 果 忆 从 
输入 中 读 和 人 Ap， 那么 不 允许 出 现 e 输 入 转移 。 

下 面 的 断言 适用 于 在 工 (G) 中 任 一 串 w 的 派生 ， 例 如 

Aq, aaa 

如 果 卫 读 入 包含 一 个 变 元 A 的 vis MA CERERA Am 之 前 进入 状态 p. 

使 用 在 i 上 的 归纳 ， 从 A ,a 派生 vi 的 步骤 数目 来 证 明 。 

归纳 基础 : ;一 0。 

ERRER DF, vi = Aasa A PARS qo 开始 ， 所 以 归纳 基础 正确 。 

归纳 步骤 假定 断言 对 i 成 立 ， 证 明 其 对 i 十 1 也 成 立 。 

首先 考虑 如 下 情况 ，v; 二 xApgy 且 Ap 是 在 步骤 wv; 过 viti 中 替换 的 变 元 。 归 纳 假设 表 
H PECERA TZA, ERANTS A 之 前 进入 状态 p。 根 据 G 的 构造 过 程 ， 替 换 规则 可 
能 有 两 种 类 型 . 

lL Apg—>ApraAgh 或 

2. Agp e's 

因此 根据 选择 的 规则 类 型 v = 2ApaAeby RWE vii 二 xy。 在 第 一 种 情况 下 ， 当 P 
Æ visi PIZA AyaAsb 时 ， 我 们 知道 它 在 状态 p 开始 ， 因 为 其 刚刚 读 完 zx。 随 着 PP 在 
vii PIRA ApyaA sb5， 由 于 替换 规则 的 构造 ， 它 进入 状态 +r，s，t 和 9g 组 成 的 序列 。 因 此 ， 
它 正 好 在 读 入 Am 之 前 进入 状态 娟 ， 并 且 正 好 在 读 和 人 As 之 前 进入 状态 s， 从 而 为 这 两 种 变 
元 的 出 现 情况 建立 断言 。 断 言 在 y 部 分 的 变 元 出 现时 成 立 ， 是 因为 在 P 读 人 5 之 后 它 进 入 
状态 g 然后 读 人 串 y。 在 输入 v 上 ， 它 也 在 读 和 人 y 之 前 进入 gqg， 所 以 计算 过 程 在 vi M vi 
的 y 部 分 上 是 一 致 的 。 显 然 ， 计 算 过 程 在 z 部 分 也 是 一 致 的 。 因 此， 断言 对 vi+1 成 立 。 在 
第 二 种 情况 下 ， 没有 引入 新 的 变 元 ， 所 以 我 们 只 需要 观察 计算 过 程 在 vi 与 vit1 的 x 和 yy 
部 分 上 是 一 致 的 。 这 就 证 明了 断言 成 立 。 

G 能 通过 DK- 测 试 。 

我 们 证 明 每 一 个 DK 的 接受 状态 都 满足 DK- 测 试 的 条 件 。 选 择 这 些 接受 状态 中 的 一 
个 。 它 包含 一 个 完整 的 规则 R。 这 个 完整 的 规则 可 能 有 下 面 两 种 形式 之 一 : 

Le sdb, 

A > 

在 这 两 种 情况 下 ， 我 们 都 需要 证 明 该 接受 状态 不 会 包含 : 

a. 另 一 个 完整 的 规则 ， 
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b. 一 个 含有 终结 符 紧 跟 在 句点 之 后 的 加 点 规则 。 

我 们 分 别 考 虑 这 四 种 情况 。 在 每 一 种 情况 中 ， 我 们 从 考虑 一 个 串 z 开始，DK 在 x 上 
到 达 我 们 所 选择 的 接受 状态 。 

情况 la R 是 一 个 完整 的 类 型 1-2 规则 。 对 这 个 接受 状态 的 任意 一 个 规则 来 说 ，z 必 
定 以 这 个 规则 中 的 句点 之 前 的 符号 作为 结束 ， 因 为 DK 在 z 上 到 达 该 状态 。 因 此 在 句点 之 
前 的 符号 在 所 有 这 样 的 规则 中 一 定 是 一 致 的 。 这 些 符号 在 尺 中 是 AwaAvp， 所 以 任意 其 他 
类 型 1-2 的 完整 规则 的 右边 一 定 有 相同 的 符号 。 同 样 左边 的 变 元 一 定 也 是 一 致 的 ， 所 以 规 
则 一 定 都 是 相同 的 。 

假定 接受 状态 包含 R 和 某 个 类 型 3 的 完整 MMT. AR 中 我 们 知道 z 以 ApaAsb 
结束 。 此 外 ， 我 们 知道 P 在 z WRIA. AWARE G 的 构造 过 程 弹 栈 操作 在 R 的 那个 
位 置 执行 。 根 据 我 们 建立 DK 的 方式 ， 在 某 个 状态 的 完整 e 规 则 一 定 由 一 个 加 点 规则 推导 
出 来 ， 该 加 点 规则 驻 留 的 状态 满足 : 句点 不 在 一 开始 的 位 置 且 句点 之 后 紧 接着 某 个 变 元 。 
(一 个 例外 出 现在 DK 的 开始 状态 ， 这 里 句点 可 能 出 现在 规则 的 开始 位 置 ， 但 是 这 个 接受 
状态 不 能 是 开始 状态 ， 因 为 它 包 含 了 一 个 完整 的 类 型 1-2 规则 。) 这 意味 着 在 G 中 ，T 由 
一 个 类 型 1-2 的 加 点 规则 推导 得 到 ， 在 这 个 规则 中 句点 在 第 二 个 变 元 之 前 。 根 据 G 的 构造 
Wt, ， 一 个 压 栈 操作 正好 在 句点 之 前 出 现 。 这 说 明 书 在 xz 的 最 后 执行 了 一 个 压 人 转移 ， 这 
与 我 们 之 前 的 论断 是 矛盾 的 。 所 以 不 存在 完整 规则 工 。 另 一 方面 ， 任 一 类 型 的 第 二 个 完 
整 规则 不 会 出 现在 这 个 接受 状态 。 

情况 2a R 是 一 个 完整 的 e- 规 则 A ps 一 . 。 我 们 证 明 没 有 男 一 个 完整 的 ee 规则 Aw 一. 
能 够 与 R 共存 。 如 果 这 样 的 规则 存在 ， 那 么 之 前 的 断言 证 明 在 读 和 人 zx 之 后 P 一 定 在 p 中 
HERA z 之 后 它 也 一 定 在 gq 中。 因此 p= 二 gqg， 两 个 完整 的 ee 规则 是 相同 的 。 

情况 1b R 是 一 个 完整 的 类 型 1-2 规则 。 从 情况 1a 中 ， 我 们 知道 已 在 z 的 最 后 弹 栈 。 
假设 接受 状态 也 包含 一 个 加 点 规则 T， 在 工 中 一 个 终结 符 紧 跟 在 句点 之 后 。 从 工 PRI 
知道 PP 不 能 在 z 的 最 后 弹 栈 。 这 个 矛盾 说 明 这 种 情况 是 不 会 出 现 的 。 

情况 2b 尺 是 一 个 完整 的 = 规则 。 假 设 接受 状态 也 包含 一 个 加 点 规则 工 , 在 工 中 一 
个 终结 符 紧 跟 在 句点 之 后 。 因 为 工 是 类 型 1-2 的 ， 所 以 一 个 变 元 符号 之 后 紧 接 着 句点 ， 
那么 z 以 这 个 变 元 符号 作为 结束 。 此 外 , 在 书 读 入 z 之 后 ， 它 为 读 入 一 个 非 s 输 入 符号 
做 好 了 准备 ， 因 为 一 个 终结 符 跟 在 句点 之 后 。 就 如 同 在 情况 lah, CRN MM RM 
一 个 类 型 1-2 加 点 规则 S 中 推导 得 到 ， 在 S 中 句点 之 后 紧 接 着 第 二 个 变 元 。 (再 一 次 ， 
这 个 接受 状态 不 能 是 DK 的 开始 状态 ， 因 为 句点 不 在 工 的 开始 位 置 出现 。) 因此 在 S 中 
ERAS a€ 3 之 后 紧 接着 出 现 句 点 ， 所 以 z 以 a 作为 结束 。 不 论 是 a€5 还 是 4 二 8， 
因为 = 以 一 个 变 元 符号 作为 结束 ，a 儿 5 所 以 a 二 e。 因 此 ,在 P 读 人 zz 之 后 ， 在 它 为 处 
H a 执行 = 输入 转移 之 前 ， 它 为 读 入 一 个 s 输 入 做 好 了 准备 。 在 之 前 我 们 也 证 明了 P E 
此 刻 为 读 和 一 个 非 s 输 入 符号 做 好 了 准备 。 但 是 不 允许 DPDA 同时 执行 = 输入 转移 以 及 
在 给 定 状 态 和 栈 读 和 人 一 个 非 s 输 入 符号 的 转移 ， 所 以 上 述 情况 不 可 能 出 现 。 因 此 情况 2b 
不 会 发 生 。 a 


2.4.4 语法 分 析 和 LR(K) 文法 


确定 型 上 下 文 无 关 语 言 有 着 重要 的 实际 意义 。 它 们 对 于 成 员 关 系 和 语法 分 析 的 算法 都 
基于 DPDA， 因 此 这 些 算法 都 是 高 效 的 ， 且 它们 包含 了 丰富 的 涵盖 大 多 数 编程 语言 的 CFL 
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X., Siti, DCFG 有 时 在 表达 特殊 的 DCFL 时 不 方便 。 其 关于 所 有 句柄 都 是 强制 的 要 求 ， 
对 于 设计 直观 的 DCFG 是 个 障碍 。 

音 运 的 是 ， 一 个 叫 作 LRA 的 宽泛 文法 类 让 二 者 相得益彰 。 它 们 与 DCFG 非常 近似 ， 
都 允许 到 DPDA 的 直接 转变 。 同 时 它们 在 很 多 应 用 上 有 足够 的 表达 力 。 

LR(k) 文法 的 算法 引入 了 前 脆性 (lookahead), Æ DCFG 中 ， 所 有 的 句柄 都 是 强制 
的 。 一 个 句柄 只 依赖 于 一 个 包括 句柄 的 有 效 串 上 的 符号 ， 不 依赖 于 在 该 句柄 之 后 的 终结 
符 。 在 LRCR) 文 法 中 ， 一 个 句柄 可 能 也 依赖 于 该 句柄 之 后 的 符号 ， 但 只 依赖 于 其 中 的 前 到 
个 。 首 字母 缩 略 词 LR(k) 表 示 : 从 左 到 右 的 输入 处 理 (Left to right input processing), Hx 
右派 生 (Rightmost derivation) 〈 或 者 等 价 地 ， 最 左 归 约 ) 和 前 瞻 的 & 个 符号 。 

为 了 使 其 更 为 精确 ， 令 h 为 有 效 串 v 二 xhy 的 一 个 句柄 。 如 果 瑚 对 每 一 个 有 效 串 chy 
(chy 满足 yE€E3* H y My 在 它们 前 & 个 符号 上 是 一 致 的 ) 来 说 是 独一无二 的 句柄 ， 那 么 
AA h ÆRA k 所 强制 的 (forced by lookahead &) 。( 如 果 其 中 某 个 串 的 长 度 小 于 &， 那 
么 一 致 的 长 度 与 这 个 短 串 的 长 度 相 同 ,) 

若 LR(K) 文 法 的 每 一 个 有 效 串 的 句柄 都 是 被 前 瞻 有 所 强制 的 ， 那 么 该 
LR(k) 文 法 是 上 下 文 无 关 文 法 。 

因此 DCFG 与 LR(0) 文 法 相同 。 我 们 能 够 证 明 对 任意 一 个 kk， 能 将 文法 LR(k) 转换 
成 DPDA。 我 们 已 经 证 明 DPDA 与 LR(0) 文 法 等 价 。 因 此 LRA) HEM ATA k 和 所 有 DC- 
FL 的 准确 描述 在 能 力 上 是 等 价 的 。 下 面 的 例子 说 明 ，LR(1) 文法 比 DCFG 更 为 方便 描述 
特定 的 语言 。 

为 了 避免 烦琐 的 符号 和 技术 性 的 细节 ， 我 们 仅 展 示 当 k=1 时 如 何 将 LR(k) 文法 转换 
成 DPDA。 更 为 一 般 性 的 转换 过 程 在 本 质 上 与 此 相同 。 

首先 ， 我 们 提出 一 个 为 LR(1) 文法 做 了 修改 的 DK- 测 试 的 变形 ,我 们 将 其 称 为 前 瞻 
为 1 的 DPK- 测 试 ， 或 简 记 为 DK -测试 。 如 之 前 一 样 ， 我 们 将 构造 一 个 NFA， 这 里 称 为 
Ki, FRR RRM DFA DK1。Ki 的 每 一 个 状态 都 有 一 个 加 点 规则 Tu. v 和 一 个 称 为 前 
M47 (lookahead symbol) MAA a, RRR (Tuv a ]。 这 个 状态 说 明 Ki 最 近 已 
BAT P u, WR vu 之 后 出 现 并 且 a 在 v 之 后 出 现 ，w 可 能 为 句柄 uv 的 一 部 分 。 

绝 大 部 分 的 形式 化 构造 工作 与 之 前 的 相同 。 对 每 一 个 包括 起 始 变 元 S; 和 所 有 aes 的 
规则 ， 开 始 状态 有 一 个 到 (Si>. uo ] 的 e- 转 移 。 变 换 转 变 (shift transition) 在 输入 zx 上 
将 (T>u. zu a] 变 为 [>uz.v a), 这 里 x 是 一 个 变 元 符号 或 者 终结 符 。 对 每 一 个 规则 
C 一 r，e- 转 变 (e-transition) 将 (T=>u. Co a ] 变 为 Car è), 这 里 5 是 能 从 中 派生 
出 来 的 任意 终结 符 串 的 第 一 个 符号 。 如 果 wv 派生 出 s， 那么 添加 56 二 a。 对 完整 规则 Bu. 
和 aE3， 所 有 的 接受 状态 都 是 (Bou a), 

S R 是 带 前 脆 符 号 al 的 完整 规则 ，R, 是 带 前 有 瞻 符 号 a: 的 加 点 规则 。Ri AR, 是 一 
致 的 (consistent)， 如 果 

1. Ro 是 完整 的 且 a=a., XK 

2. Ro 不 是 完整 的 且 a 紧 跟 在 句点 之 后 。 

现在 我 们 已 经 做 好 准备 来 描述 DK, -测试 。 构 造 DFA DK1。 测试 保证 每 一 个 接受 状 
态 一 定 不 包含 任意 两 个 一 致 的 加 点 规则 。 


G 通过 DK1- 测 试 当 且 仅 当 G 是 一 个 LR(1) 文法 。 
证 明 思 路 ”推论 2. 32 仍 适 用 于 DK1 ， 因 为 我 们 可 以 忽略 前 瞻 符 号 。 a 
这 个 例子 说 明了 下 面 的 文法 通过 了 DK -测试 〈 见 图 2- 22)。 回 忆 在 例 
2.34 中 这 个 文法 不 能 通过 DK- 测 试 。 因 此 它 是 一 个 LR(1) 文法 的 例子 而 不 是 一 个 DCFG 
的 例子 。 
S>E- 
E>E+T | T 
T>TXa|a 


S~+-EA a+xc S+E-- a+xc 
E>.E+T +4 E>E.4+T +4 
E>.T 十 十 

T=>,TXa x4c 十 
Ta X 十 十 


E~E+-T +4 T 


T>-TXxXa x+-4 
T>.a x+4 


T>T-Xa 





fl 2-22 通过 DK: - Wik m 
结束 标记 语言 由 LR(1) 文 法 生成 当 且 仅 当 它 是 一 个 DCFL。 

我 们 已 经 证 明了 每 一 个 DCFL 都 有 一 个 LR(0) 文法 ， 因 为 一 个 LR(0) 文法 与 一 个 
DCFG 相同 。 这 就 证 明了 定理 的 必要 性 。 剩 下 的 就 是 下 面 这 个 引 理 ,说 明了 如 何 将 LR(1) 
文法 转换 成 DPDA. 

每 一 个 LR(1) 文法 都 有 一 个 等 价 的 DPDA。 

证 明 思 路 ”我 们 构造 P; ， 一 个 我 们 在 引 理 2. 45 中 提 到 的 DPDA P 的 修改 版 本 。P， 
读 入 它 的 输入 并 模拟 DK1 ， 同 时 使 用 栈 来 记录 若 所 有 归 约 步骤 应 用 于 目前 的 输入 ，DK: 
可 能 进入 的 状态 。 此 外 ，Pi 向 前 读 入 1 个 符号 并 将 这 个 前 瞻 信 息 存储 到 它 的 有 穷 状态 存 
储 (finite state memory) 中 。 每 当 DK; 达到 一 个 接受 状态 ，P1 查询 它 的 前 瞻 来 判断 是 否 
执行 一 个 归 约 步骤 ， 并 在 有 多 种 可 能 时 判断 执行 哪 一 个 步 又 。 因 为 文法 是 LR(1)， 所 以 只 


有 一 种 选择 。 z 
练习 
2.1 回忆 一 下 例 2. 3 中 给 出 的 CFG Gs 。 为 方便 起 见 ， 用 单字 母 重新 命名 它 的 变 元 如 下 : 
E->E+T|T 
T--TXF|F 
F-+(E)|a 
给 出 下 述 字 符 串 的 语法 分 析 树 和 派生 : 


a. a b. ata c.atata d. ((a)) 
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2.2 a. 利用 语言 A={a™b"c"|m,n>0) 和 B= {arbre |m,n>0) 以 及 例 2. 20， 证 明 上 下 文 无 关 语言 
类 在 交 运 算 下 不 封闭 。 
b. 利用 (a) 和 德 ， 摩 根 律 〈 定 理 0. 10)， 证 明 上 下 文 无 关 语言 类 在 补 运算 下 不 封闭 。 
A2.3 设 上 下 文 无 美文 法 G， 


R—>XRX|S 

S—aTb|bTa 

T~>XTX|Xle 

X—a\b 
回答 下 述 问 题 : 
a. G 的 变 元 是 什么 ? b. G 的 终结 符 是 什么 ? 
c.G 的 起 始 变 元 是 什么 ? d. 给 出 L(G) 中 的 3 个 字符 串 。 
e 给 出 不 在 工 (G) 中 的 3 个 字符 串 。 f. EREB: T =>aba。 
g. 是 真是 假 : Taba. h 是 真是 假 ; ToT. 
i 是 真是 假 : TST. j 是 真是 假 : XXX aba, 
k. 是 真是 假 : X Saba. L. EEB: T>XX., 
m HEBR: TSXXX. n HRB: Se. 


o 用 普通 的 语言 描述 L(G). 
2.4 ” 设 字 母 表 是 410,1)， 给 出 产生 下 述 语言 的 上 下 文 无 关 文 法 : 
Aa. {w|w 至 少 包 含 3 个 1}。 
b. {w| w 以 相同 的 符号 开始 和 结束 }。 
c (w w 的 长 度 为 奇数 }。 
Ad. (w| w 的 长 度 为 奇数 且 正 中 间 的 符号 是 0} 。 
e. {wlw=w, Bl w 是 一 个 回 文 }。 
f. 空 集 。 
2.5 给 出 关于 练习 2.4 中 语言 的 下 推 自动 机 的 非 形式 化 描述 和 状态 图 。 
2.6 给 出 产生 下 述 语言 的 上 下 文 无 关 文 法 : 
Aa. 字母 表 (a, b 上 a 多 于 b 的 所 有 字符 串 组 成 的 集合 。 
b. 语言 {a"b” | n>0}) 的 补 集 。 
Ac. {wHr|w, rE {0,1)* Hur Æ rør). 
d. (x1 # x2 # ee Ha, |kR>1, B—-P2z€lab}*, BHEE i Mj Erk). 
^2.7 给 出 关于 练习 2.6 中 语言 的 PDA 的 非 形式 描述 。 
A 2.8 证 明 在 2.1 节 开始 部 分 给 出 的 文法 G。 中， 字符 串 “the girl touches the boy with the flower” 有 两 
个 不 同 的 最 左派 生 ， 人 叙述 这 句 话 的 两 个 不 同 的 意思 。 
2.9 给 出 产生 语言 
A 二 {aibict|i,j,k 之 0 H i=j Mj =k} 
的 上 下 文 无 关 文法 。 你 给 出 的 文法 是 歧义 的 吗 ? 为 什么 ? 
2.10 给 出 识别 练习 2.9 中 语言 A 的 下 推 自动 机 的 非 形 式 化 描述 。 
2.11 用 定理 2. 12 中 给 出 的 过 程 ， 把 练习 2. 1 中 的 CFG G 转换 成 等 价 的 PDA。 
2.12 用 定理 2.12 中 给 出 的 过 程 ， 把 练习 2.3 中 的 CFG G 转换 成 等 价 的 PDA。 
2.13 KH G=(V,5,R,S), HP V={S,T,.U},5={(0,4}, 是 下 述 规则 的 集合 : 
S—TTIU 
T->0T| TO|# 
U—>0U00| # 
a. 用 普通 的 语言 描述 LCG. 


98 


> 
* * 
~~ p 


* * 
ko N 


yoy 


~ 25 


. 26 


27 
. 28 


* 2.29 


B-RA 自动 规 与 语言 


b. WH L(G) 不 是 正则 的 。 
用 定理 2. 6 中 给 出 的 过 程 ， 把 下 述 CFG 转换 成 等 价 的 乔 姆 斯 基 范 式 文法 。 

A—>BAB|B|e 

B—>00|e 
给 出 一 个 反例 证 明 下 述 构造 不 能 证 明 上 下 文 无 关 语言 类 在 星 号 运算 下 封闭 。 设 CFL A hH CFG G 
=(V,5,R,S) 产生 ,将 G 增 加 一 条 新 规则 S 一 SS 并 称 其 为 G ， 这 个 语法 可 产生 语言 A* 。 
证 明 上 下 文 无 关 语言 类 在 并 、 连 接 和 星 号 三 种 正则 运算 下 封闭 。 
先 说 明 如 何 把 正则 表达 式 直接 转换 成 等 价 的 上 下 文 无 关 文 法 ， 然 后 利用 练习 2. 16 WAR, A 
出 每 一 个 正则 语言 都 是 上 下 文 泛 关 的 另 一 种 证 明 。 


考虑 下 面 的 CFG G: 

S—=SS|T 

T—aTb | ab 
描述 L(G) 并 证 明 G 是 歧义 的 。 给 定 一 个 非 歧义 文法 H, WE LCA)=L(G), Bi A 
非 歧 义 的 。 
我 们 定义 语言 A 的 旋转 闭 包 (rotational closure) H RC(A)={yxz|zxy€ A}. WH CFL 类 在 旋 
转 闭 包 下 是 封闭 的 ，。 
我 们 定义 语言 A 的 CUT 为 CUT(A) 二 {yzxz|zyz€ A}. 证明 CFL 类 在 CUT 下 不 是 封闭 的 。 
证 明 每 一 个 DCFG 是 一 个 非 层 义 的 CFG. 
证 明 每 一 个 DCFG 产生 一 个 前 缀 无 关 语 言 。 
证 明 DCFL 类 在 下 面 的 运算 下 不 是 封闭 的 : 
a. 并 b. 交 c. 连接 d. 星 号 e. pi 
设 下 面 的 文法 为 G: 

S 一 二 
T—TaTb| TbTale 

a. 证 明 L(G) 二 {wj | 双 包 含 相同 个 数 的 a 和 b)}。 通 过 使 用 在 w 的 长 度 上 的 归纳 法 来 证 明 。 
b. 使 用 DK- 测 试 来 证 明 G 是 一 个 DCFG。 
c 描述 DPDA 识别 L(G， 的 过 程 。 
设 例 2.28 中 引入 的 如 下 文法 为 G1。 使 用 DK- 测 试 来 证 明 Cl 不 是 一 个 DCFG。 

RsS|IT | 

S—>aSb|ab 

T—aTbb| abb 
设 A=L(G), G 在 问题 2. 25 中 已 被 定义 。 证 明 A 不 是 一 个 DCFL。 (提示 : 假设 A 是 一 个 
DCFL， 考 虑 它 的 DPDA P. 修改 PP 使 其 输入 字母 表 为 {a,b,c}。 当 它 第 一 次 进入 一 个 接受 状 
态 时 ， 从 此 时 开始 其 假定 输入 中 的 c 都 是 b。 修 改 的 PP 能 够 接受 什么 语言 ?) 
设 B= {abc |i, j, k>0 H i=j Mi=k}. 证明 B 不 是 一 个 DCFL. 
设 C= 二 {wwr |wE 1{0,1}* }。 证 明 C 不 是 一 个 DCFL。( 提 示 : 假设 当 某 个 DPDA P ERR KR 
顶部 的 带 有 符号 z 的 状态 gq 开始 时 ， 无 论 己 在 此 时 读 人 了 怎样 的 输入 串 ， 忆 都 不 弹出 在 z 下面 
的 栈 。 在 这 种 情况 下 ， 此 时 了 栈 的 内 容 不 会 影响 它 接 下 来 的 行为 ， 所 以 P 接 下 来 的 行为 只 依赖 
Far.) 
如 果 我 们 不 允许 在 CFG 中 有 se 规则 ， 那 么 可 以 简化 DK- 测 试 。 在 简化 后 的 测试 中 ， 我 们 只 需 
要 检查 DK 的 每 一 个 接受 状态 是 否 有 一 个 单一 的 规则 。 证 明 一 个 不 带 e 规 则 的 CFG 能 够 通过 简 
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#2, 30 


"231 


“2. 40 


“2.41 
2. 42 


2. 43 
2. 44 


“2. 45 


化 后 的 DK- 测 试 当 且 仅 当 它 是 一 个 DCFG。 
a 设 C 是 上 下 文 无 关 语 言 ，R 是 正则 语言 。 证 明 语 言 C 站 R 是 上 下 文 无 关 的 。 
b. 利用 (a) 证 明 语 言 
A={w|w€ {a,b,c}* , 且 含 有 数目 相同 的 a.b 和 c) 
不 是 上 下 文 无 关 的 。 
WA CFG G: 
S—aSb|bY|Ya 
Y—bY | aY |e 
用 通常 的 语言 给 出 L(G) 的 简单 描述 ， 并 利用 这 个 描述 给 出 L(G) 的 补 集 L(G) 的 CFG. 
it A/B= {w|wrE€A, H x€B}, 证 明 如 果 A 是 上 下 文 无 关 语 言 且 B 是 正则 语言 ， 则 A/B 是 
上 下 文 无 关 语 言 。 
对 于 字母 表 3= {a,b}， 给 出 产生 所 有 a 的 个 数 是 b 的 两 倍 的 字符 串 的 语言 的 CRG， 并 证 明 其 正 
确 性 。 
设 C={z#yla,yE{0,1}*, Hay}, WEA CHE FMALKBE. 
w D={zyl|z,yE{0,1}*, H |x| =| y| r#y}, 证 明 D 是 上 下 文 无 关 语 言 。 
设 E=({a'b’ |i 关 7 H 2i 关 j}， 证 明 玉 是 上 下 文 无 关 语 言 。 
对 任 一 语言 A， 令 运算 符 SUFFIX(A) = {v| FER u, uve A}, 证 明 上 下 文 无 关 语言 类 在 
SUFFIX 运算 下 封闭 。 
设 G 是 一 个 乔 姆 斯 基 范 式 CFG, WEAR: 对 于 任 一 长 度 为 n(n 宇 1) 的 字符 串 wEL(G), 通过 
CFG G 将 其 派生 出 来 恰好 需要 2n 一 1 步 。 
设 文法 G=(V,5,R,(STMT)) WF: 
‘STMT)—(ASSIGN) | (IF-THEN) | (IF-THEN-ELSE) 
(IF-THEN)~ jf condition then (STMT) 
(IF-THEN-ELSE)— if condition then (STMT) else (STMT) 
(ASSIGN)—a:=1 
>= (if, condition, then, else,a: =1} 
V={<(STMT), (IF-THEN) , (IF-THEN-ELSE) , (ASSIGN) } 
G 是 程序 设计 语言 的 一 个 片断 的 文法 ， 虽 然 看 上 去 很 上 自然， 但 它 是 有 歧义 的 。 
a. 证 明 G 是 歧义 的 。 
b. 给 出 一 个 与 G 产生 相同 语言 的 非 上 层 义 文法 。 
给 出 下 列 语言 的 非 层 义 CFG: 
a. (w| 对 于 w 的 每 一 个 前 级 , a 的 个 数 不 小 于 b 的 个 数 } 
b. {wlw 中 a 的 个 数 和 b 的 个 数 相 等 ) 
c. {w| w 中 a 的 个 数 不 小 于 b} 
证 明 练 习 2.9 中 的 语言 A 是 固有 歧义 的 。 
用 泵 引 理 证 明 下 述 语言 不 是 上 下 文 无关 的 : 
a. (0*1°0*1* |a=0) 
Ah. (0 #071 H0 | n0} 
Ac. {w#t|w,tE {a,b}*, Hwt 的 子 串 ) 
d. {t) # tz Ho Htl k>2,t: € {a,b} *, HFE IA; Et) 5t) 
设 语言 BRA (0,1》 上 具有 回 文 性 质 的 字符 串 组 成 且 0，1 个 数 相同 ， 证 明 B 不 是 上 下 文 无 关 的 。 
对 于 字母 表 I=(1,2,3,4) 上 的 语言 C= 一 {wE 3* | 在 也 中 ,1 与 2 的 个 数 相同 ,3 与 4 的 个 数 相 
同 }， 证 明 C 不 是 上 下 文 无 关 语 言 。 
证 明 语言 F= {abi | 存在 正 整数 &， 有 i 关 &i} 不 是 上 下 文 无 关 的 。 
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P-A 自动 规 与 语言 


考虑 语言 B=L(G), RP G 是 练习 2. 13 中 给 出 的 文法 ， 定 理 2. 19 关于 上 下 文 无 关 语言 的 泵 引 
理 称 存 在 关于 BHRKE p。 试 计算 p 的 最 小 值 并 验证 结果 的 正确 性 。 

设 G 是 一 个 含有 2 个 变 元 的 乔 姆 斯 基 范 式 CFG, 证 明 : 如 果 G 派生 出 某 个 字符 串 时 使 用 了 至 少 
2°36, M L(G) 是 无 穷 的 。 

试 给 出 一 个 语言 示例 ， 它 不 是 上 下 文 无 关 的 ， 但 却 满足 CFL 关于 泵 引 理 的 三 个 条 件 。 要 求 给 出 
证 明 (参考 问题 1. 49 中 关于 正则 语言 的 类 似 示例 )。 

证 明 下 述 强 泵 引 理 ， 要 求 在 划分 字符 串 sht, vA y 都 非 空 。 

如 果 A 是 上 下 文 无 关 语言 ， 则 存在 一 个 数 &， 使 得 A 中 任 一 长 度 不 小 于 的 字符 串 都 可 以 划分 
成 5 段 ，s 二 wzyz， 且 满足 下 述 条 件 : 

a. 对 每 一 个 i>0, uvizry'zEA, 

b. vže H ye, 

c. | vzy|Sk. 

参照 问题 1. 31 中 关于 perfect shuffle 运算 符 的 定义 ， 证 明 上 下 文 无 关 语 言 类 在 perfect shuffle jz 
算 下 不 封闭 。 

参照 问题 1. 32 中 关于 shuffle 运算 符 的 定义 ， 证 明 上 下 文 无 关 语 言 类 在 shuffle 运算 下 不 封闭 。 
对 于 一 个 语言 中 的 任 一 字符 串 ， 如 果 串 的 所 有 前 缀 也 在 这 个 语言 内 ， 则 称 该 语言 是 前 封闭 的 。 
证 明 : 一 个 无 穷 大 的 前 封闭 上 下 文 无 关 语 言 C 包含 一 个 无 穷 大 的 正则 语言 子 集 。 

理解 问题 1. 45 中 关于 NOPREFIX(A) 及 NOEXTEND(A) 的 定义 并 证 明 : 

a. 上 下 文 无 关 语 言 类 在 NOPREFIX 下 不 封闭 。 

b. 上 下 文 无 关 语 言 类 在 NOEXTEND 下 不 封闭 。 

对 于 欠 母 表 3= 二 {1, 间 } LBA Y=({(w | w=t tnt Ft, RP k20, tEl*, HH iFj, 
A ttj), WEY 不 是 上 下 文 元 关 语 言 。 

对 于 字符 串 w 和 t+， 如 果 二 者 字符 数 相 等 且 组 成 的 字符 相同 (只 是 字符 在 串 中 的 顺序 不 同 )， 则 


称 w 三 :。 在 此 基础 上 给 出 SCRAMBLE 定义 如 下 : 对 字符 串 w， 有 SCRAMBLE(w) =({t|t = 
w), XERA A， 有 SCRAMBLE(A)=({t| FE we A, 使 得 1:€ SCRAMBLE(w)} . 

a. 证 明 : 给 定 字 母 表 2={0,1)}， 正 则 语言 SCRAMBLE 运算 后 成 为 上 下 文 无 关 语言 。 

b. 当 字 母 表 包含 3 个 或 更 多 符号 时 会 有 什么 样 的 结果 ? 证 明 你 的 结果 。 

Sema A, B, A AOB={zylcz€A,yEB,H|zl=lyl}, HEA: 如 果 A，B 是 正则 语言 ， 则 
AQ〖QB 上 下 文 无 关 。 

设 A={wtw® |w,t€E10,1}* 且 |w|==1z|},， 证 明 A 不 是 上 下 文 无 关 语 言 。 

wI=-(0,1}, 为 后 一 半 中 至 少 包 含 一 个 1 的 串 的 集合 。 换 句 话 说 ，B= 二 {uv|u€53*,vE€ 
Br* | 人 | | 人 | 

a. 设计 一 个 能 识别 B 的 PDA, 

b. 设计 一 个 能 识别 B 的 CFG. 

WI={(0.1}, QC 为 在 三 分 段 中 间 部 分 包含 一 个 工 的 所 有 串 的 语言 ，C。 为 在 三 分 段 中 间 部 分 包 
BAT 1 的 所 有 串 的 语言 。 所 以 Cl ={zyz|z,zES* ,yEs* 15", |zcz|=l[z|Slyl},.Q= 
{xyz|z,zEd* ,yEs*15*15* ,|z|=|z| 宇 |y|}. 

a. 证 明 Ci 是 CFL. b. 证 明 C: 不 是 CFL. 


习题 选 解 
A b.a, b; 


c. R; d.G 的 三 个 字符 串 为 ab，ba，aab; 
e 不 在 G 中 的 三 个 字符 串 为 a，b，s; f. False; 


2.4 


2. 6 


2.7 


2.8 
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g. True; h. False; 
i. True; j. True; 
k. False; l. True; 
m. True; n. False; 


o L(G) 包含 所 有 不 具有 回 文 性 质 的 a、b 串 。 

a. S>R1R1R1R R>OR|1Rle 

d. S—0 | 0S0 | 0S1 | 1S0 | 151 

a. ”ia 
T—TT|aTb|bTalale 
工 生 成 的 字符 串 满 足 a 的 个 数 不 少 于 上 b 的 个 数 ，S 使 得 a 的 个 数 增 加 1. 

SIA 
T—0T0|1T1| #X 
X—>0X|1Xļe 

a. PDA 用 栈 计算 出 a 的 个 数 减 去 b 的 个 数 的 值 ， 当 计数 为 正 数 时 进入 接受 状态 。 具 体操 作 如 下 : 
PDA 扫描 输入 ， 如 果 栈 顶 为 a 时 其 读 到 b， 则 将 a 弹出 栈 顶 。 如 果 栈 顶 为 b 时 其 读 到 a， 则 将 b 
弹出 栈 项。 如 果 栈 顶 值 与 读 到 的 值 相同 ， 则 将 读 到 的 字符 压 人 栈 。 扫 描 结 束 后 ， 如 果 栈 顶 为 a 则 
接受 ， 否 则 拒绝 。 

c PDA 扫描 输入 并 将 值 压 入 栈 直至 其 读 到 字符 # ， 如 果 没 有 出 现 # ， 则 拒绝 。 然 后 PDA 在 输入 上 
随机 移动 ， 并 非 确 定性 地 在 某 一 时 刻 停止 移动 ， 在 停止 点 ，PDA 将 下 一 个 输入 字符 与 栈 顶 符号 
进行 比较 ， 只 要 不 匹配 或 者 在 栈 非 空 的 情况 下 已 经 完成 对 输入 的 扫描 ， 则 拒绝 该 分 支 。 在 没 结 
束 扫描 输入 情况 下 如 果 栈 被 清空 ， 则 PDA 读 取 余下 的 输入 并 进入 接受 状态 。 

派生 过 程 如 下 : 

句子) 一 (名 词 短语 》( 动 词 短 语 一 

(复杂 名 词 )( 动 词 短语 ) 一 

《和 冠 词 (名 词 )( 动 词 短语 一 

The 《名词 (动词 短语 一 

The girl 《动词 短语 ;一 

The girl 复杂 动词 (介词 短语 一 

The girl 《动词 (名 词 短语 》( 介 词 短 语 一 

The girl touches (4% ia] 18) (St i BIB) — 

The girl touches《〈 复 杂 名 词 兴 介词 短语 > 一 

The girl touches < 7£ iJ) «4% ial) (4p ie) IB) — 

The girl touches the (4% iA) ) <4} im] LIB) —> 

The girl touches the boy (介词 短语 ;一 

The girl touches the boy (介词 );( 复 杂 名 词 ); 一 

The girl touches the boy with (复杂 名 词 ) 一 

The girl touches the boy with 〈 冠 词 )( 名 词 ) 一 

The girl touches the boy with the ‘名词; 一 

The girl touches the boy with the flower 

为 一 种 最 左派 生 方法 如 下 : 

句子) 一 《名 词 短 语 》( 动 词 短 语 》 一 > 

(复杂 名 词 )( 动 词 短 语 ; 一 

( 冠 词 )( 名 词 ) (动词 短语 ; 一 

The (名 词 )( 动 词 短 语 ; 一 
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The girl 《动词 短语 ; 一 

The girl (复杂 动词 一 

The girl (动词)( 名 词 短 语 ; 一 


The girl touches (名 词 短 语 ; 一 


The girl touches (复杂 名 词 );( 介 词 短 语 ; 一 
The girl touches 〈 冠 词 )( 名 词 )〈 介 词 短 语 ; 一 
The girl touches the (4% ia]) (MR BIB) 一 
The girl touches the boy (介词 短语 ; 一 


The girl touches the boy 介词) 复杂 和 名词》 
The girl touches the boy with (复杂 和 名词》 


The girl touches the boy with〈 冠 词 );〈( 名 词 》 
The girl touches the boy with the (名 词 ) > 
The girl touches the boy with the flower 


当 女 孩 碰 男孩 时 他 正 拿 着 花 


我 们 不 能 归 约 Six 
2. 30 


每 个 派生 对 应 不 同 的 意思 ， 对 于 第 一 个 派生 ， 句子 的 意思 是 女孩 用 花 去 碰 男 孩 第 二 个 派生 表明 
| 

是 有 效 串 所 以 二 者 都 有 句柄 ， 且 这 些 句 柄 一 定 一 致 ， 因 为 我 们 可 以 写成 w= chy 和 wz = chyz= 
JA 2 


我 们 使 用 反 证 法 证 明 。 假 定 w 和 wz ELG 中 两 个 不 相同 的 串 ， 这 里 G 是 一 个 DCFG 
这 就 是 一 个 矛盾 


二 者 都 

xhy， 这 里 及 是 w 的 句柄 。 因 此 ，w 和 wz 的 第 一 个 归 约 步骤 分 别 产 生 有 效 串 x All uz 
o> ity BL 
| 

a 设 C 为 上 下 文 无 关 语 言 ，R 为 正则 语言 ，P 为 识别 C K PDA, D 为 识别 R W DFA, QAP H 
状态 集 ，Q 为 DD 的 状态 集 ， 构 造 一 
实现 P 的 动作 的 同时 还 能 记录 下 DD 的 状态 。 
上 下 文 无 关 语 言 
b. i 


我 们 继续 


这 个 过 程 直到 得 到 Si 和 Siz, RBS, 是 起 始 变 元 。 然 而 Si 并 不 会 出 现在 任何 规则 的 右边 ， 所 以 
2.42 


个 PDA P' 用 于 识别 CN 站 R，P' 的 状态 集 为 QRXQ。 则 P'E 
$w, HH Fp EP 的 接受 状态 集 ，Fp 是 的 接受 状态 集 ， 因 为 CN 站 R HRP 识别 
{a"*b*c* | a20}, 
b. 设 B={0" # 
不 能 被 抽取 


它 能 且 只 能 接受 在 状态 GE Fp X Fp 处 停机 的 字符 
027” + 03" In 宇 0 


故 其 为 
PARKE.,. WFFAB s 二 0z + 072 + 03h 


设 R 是 正则 语言 a*b* c* ， 如果 A 是 CFL， 则 根据 a) 有 ANR 也 是 CFL， 然 而 对 于 ANR= 
之 0}， 

v 和 yy 都 不 可 能 包含 # ， 否 则 cv wy’ = 将 多 于 两 个 # ， 如 果 把 用 # 分 为 三 段 02 

c 设 C={wHt| HP a conte a,b) 


由 例 2.20 得 证 其 不 是 上 下 文 无 关 语 言 ， 因 此 A 不 是 上 下 文 无 关 语 言 


FFB ;二 wvzxyz 不 能 被 抽取 


» OFF 
0 
在 # 的 同一 边 处 理 


032 


RIU s= uvryz 
j 至 少 有 一 段 不 能 包含 viy, Ae’ wy’ z: FEB HP, 否则 不 能 保持 三 段 0 的 个 数 的 比例 
{a,b 
2. 50 


设 pARKE, s=a?b? # a’b? 


= {0*1* |k>0 


| 
= 我 们 证 明 字 
v 和 y 不 能 包含 并， 否则 xwzyz 将 不 包含 # ， 从 而 此 字符 串 不 在 CH. WR vM y 都 非 空 并 


出 现在 # 的 左边 ， 则 xzyz 因 其 # 左 边 字 符 多 于 # 右边 字符 而 不 在 C 中 ， 对 于 v、y REF 
RERI 3, 
A 


{ (0a)* (Ob)* (1b)?* | k=0} 


的 右边 ， 同 理 有 uw xy xz 也 不 在 C 中 。 对 于 y he — hea a He 则 把 它们 看 作 都 出 现 
还 有 一 种 情况 是 v、y 都 非 空 且 出 现在 # 的 两 边 ， 这 种 情况 下 必 有 wv 只 包含 a，y 只 包含 b (由 
=0}, B={a*b?*|k>0}, 

如 果 C 是 CFL, 设 p WHE KI 

足 


| wzy | SP), AT zx 过 zz 中 # 左 边 的 b 多 于 右边 的 b， 因 此 其 不 在 C 中 。 


它们 的 完全 间隔 交叉 (perfect shuffle) 操作 产生 的 语言 C 
容易 看 出 A 和 B 是 CFL, 但 C 不 是 CFL， 证 明 如 下 

s= (0a)? (Ob)? C1b)2?, 
uvxyz 满足 有 泵 定理 的 三 个 条 件 。C 中 的 字符 串 有 1/44 KEW 1, 1/8 KEW a, uv? ry?z 也 应 该 满 
是 不 可 能 的 ， 从 而 有 C 不 是 上 下 文 无 关 的 


AsMKREKFpASEC, A s= 
这 个 性 质 ， 因 此 vwzy 必然 同时 包含 1 和 a， 但 因为 它们 被 2p 个 字符 分 开 且 | wzy | <p, PU 
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本 书 第 一 部 分 已 经 给 出 了 计算 设备 的 一 些 模型 。 有 穷 自 动机 能 较 好 地 描述 存储 资源 较 
少 的 设备 ， 下 推 自动 机 虽然 能 描述 具有 无 限 存储 的 设备 ， 但 其 “后 进 先 出 ”的 栈 机 制 使 其 
能 力 受 到 限制 ， 还 证 明了 这 些 模型 对 于 有 些 非 常 简单 的 任务 都 不 能 完成 。 由 于 它们 过 于 局 
限 ， 因 此 不 能 作为 计算 机 的 通用 模型 。 


3.1 图 灵机 


现在 介绍 一 个 能 力 更 强 的 计算 模型 ， 该 模型 由 图 录 (Alan Turing) 在 1936 年 提出 ， 
称 为 图 灵机 (Turing machine) 。 图 灵机 与 有 穷 自 动机 相似 ， 但 它 有 无 限 大 容量 的 存储 且 
可 以 任意 访问 内 部 数据 。 图 灵机 是 一 种 更 加 精确 的 通用 计算 机 模型 ， 能 模拟 实际 计算 机 的 
所 有 计算 行为 。 然 而 图 灵机 也 有 不 能 解 的 问题 ， 事 实 上 ， 这 些 问 题 已 经 超出 了 计算 理论 的 
极限 。 

图 灵机 (图 3- 1) 用 一 个 无 限 长 的 带子 作为 无 限 存储 ， 它 有 一 个 读 写 头 ， 能 在 带子 上 
读 、 写 和 左右 移动 。 图 灵机 开始 运作 时 ， 带子 上 只 有 答 
入 串 ， 其 他 地 方 都 是 空 的 ， 如 果 需 要 保存 信息 ， 它 可 将 
这 个 信息 写 在 带子 上 。 为 了 读 已 经 写 下 的 信息 ， 它 可 将 ere el ie lalele 
读 写 头 往 回 移动 到 这 个 信息 所 在 的 位 置 。 机 器 不 停 地 计 图 3-1 图 灵机 的 示意 图 
算 ， 直 到 产生 输出 为 止 。 机 器 预 置 了 接受 和 拒绝 两 种 状态 ， 如 果 进 入 这 两 种 状态 ， 就 产生 
输出 接受 (accept) 或 拒绝 (reject)。 如 果 不 能 进入 任何 接受 或 拒绝 状态 ， 就 继续 执行 下 
去 ， 永 不 停止 。 

下 面 是 有 穷 自动 机 与 图 灵机 之 间 的 区 别 : 

1. 图 灵机 在 带子 上 既 能 读 也 能 写 。 

2. 图 灵机 的 读 写 头 既 能 向 左 也 能 向 右 移动 。 

3. 图 灵机 的 带子 是 无 限 长 的 。 

4. 图 灵机 进入 拒绝 和 接受 状态 将 立即 停机 。 

考虑 图 灵机 Mi ， 它 检查 语言 B=(wtw|we{0,1)"}) 的 成 员 关 系 ， 即 要 设计 M, 
使 得 如 果 输 入 是 B 的 成 员 ， 它 就 接受 ， 和 否则 拒绝 。 为 更 好 地 理解 MX ， 假 设 你 自己 是 Mn ， 
想象 你 正 站 在 由 数 百 万 个 字符 构成 的 一 英里 长 的 一 个 输入 上 ， 你 的 任务 是 确定 这 个 输入 是 
否 是 忆 的 成 员 ， 亦 即 ， 确 定 这 个 输入 是 否 包含 由 符号 # 分 开 的 两 个 相同 的 字符 串 。 这 个 输 
入 太 长 ， 你 很 难 全 部 记 住 ， 但 允许 你 在 这 个 输入 上 来 回 移动 ， 并 可 以 做 记号 。 一 个 简单 的 
解决 办 法 如 下 : 在 # 两 边 对 应 的 位 置 上 来 回 移动 ， 以 检查 它们 是 否 匹配 ， 并 使 用 记号 来 记 
录 对 应 的 位 置 。 

按 上 述 方法 设计 Mi ， 让 读 写 头 在 输入 串 上 多 次 通过 ， 每 一 次 匹配 # 两 边 的 一 对 字符 。 
为 了 记录 哪些 字符 已 经 被 检查 过 ，Mi 消去 所 有 已 检查 过 的 符号 。 如 果 最 后 所 有 的 符号 都 
被 消去 ， 意 味 着 匹配 成 功 ，Mi 进入 接受 状态 ;如果 发 现 一 个 不 匹配 ， 就 进入 拒绝 状态 。 
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Mi 的 算法 如 下 : 
Mi 二 “对 于 输入 字符 串 w: 
1. 在 # 两 边 对 应 的 位 置 上 来 回 移动 。 检 查 这 些 对 应 位 置 是 否 包含 相同 的 符号 ， 
如 不 是 ， 或 者 没有 # ， 则 拒绝 。 为 记录 对 应 的 符号 ， 消 去 所 有 检查 过 的 符号 。 
2. 当 # 左 边 的 所 有 符号 都 被 消去 时 ,检查 # 的 右边 是 否 还 有 符号 ， 如 果 是 ， 则 
拒绝 ， 否 则 接受 。” 
图 3-2 是 Mi 在 输入 011000 # 011000 开始 之 3 
Ja» Mi 带子 的 几 个 非 连续 的 快照 。 -二 
对 图 灵机 M 的 描述 概略 地 说 明了 一 般 图 灵机 ooo0ogtiiooow 
的 工作 方式 ， 这 里 没有 给 出 其 全 部 细节 。 像 引入 有 一 
穷 自动 机 和 下 推 自动 机 时 所 做 的 那样 ， 使 用 形式 化 å ¥11000#x11000u... 
描述 可 以 描述 图 灵机 的 全 部 细节 。 形 式 化 描述 简短 xX1000#x11000u..， 
地 说 明 图 灵机 模型 的 形式 化 定义 中 的 每 个 部 分 , 实 yxxx#xxxxxcxd.. 
际 中 ， 为 避免 过 于 烦琐 ， 很 少 使 用 图 灵机 的 形式 化 接受 


描述 。 图 3-2 图 灵机 Mi 对 输入 0110004 
011000 的 计算 示意 图 
3. 1.1 图 灵机 的 形式 化 定义 


图 灵机 定义 的 核心 是 转移 函数 S， 它 说 明了 机 融 如 何 从 一 个 格局 走 到 下 一 格局 。 对 于 
ARAL, 的 形式 如 下 : QXIT>QXTX({L,R}， 亦 即 ， 夺 机 器 处 于 状态 9g， 读 写 头 所 在 的 
带子 方 格 内 包含 符号 a， 则 当 6(g,a)= 二 (r,6b6,L) 时 ， 机 器 写 下 符号 以 取代 a， 并 进入 状 
态 r。 第 三 个 分 量 L 或 R 指出 在 写 带 之 后 ， 读 写 头 是 向 左 (L) 还 是 向 右 (R) BH. 

图 灵机 是 一 个 7 元 组 《Q,2 了 ,64qgy vguaent lia) FP: Q TBR 
BARS, HH 

1.Q 是 状态 集 。 

2. 王 是 输入 字母 表 ， 不 包括 特殊 空白 符号 Li。 

3. 卫 是 带子 字母 表 ， 其 中 ，UET，3ZCTP。 

4.6:QXT>QXIX{L,R} 是 转移 函数 。 

5. qo EQ 是 起 始 状态 。 

6. accept 全 Q 是 接受 状态 。 

7. A reject EQ 是 拒绝 状态 ， 且 人 o 

图 灵机 M=(Q,250305q + Vaccept Drejet) 的 计算 方式 如 下 : 开始 时 ，M 以 最 左边 的 nn 
个 带子 方 格 接收 输入 包 二 wiwz… ws E53* ， 带 子 的 其 余部 分 保持 空白 〈 即 填 以 空白 符 )， 
读 写 头 从 最 左边 的 带子 方 格 开始 运行 ,注意 了 王 不 含 空白 符 ， 故 出 现在 带子 上 的 第 一 个 空白 
符 表 示 输 入 的 结束 。M 开始 运行 后 ， 计 算 根 据 转 移 函 数 所 描述 的 规则 进行 。 如 果 M 试图 
将 读 写 头 从 带子 的 最 左 端 再 向 左 移 出 ， 即 使 转移 函数 指示 的 是 L， 读 写 头 也 停 在 原 地 不 
动 。 计 算 一 直 持 续 到 它 进 入 接受 或 拒绝 状态 ， 此 时 停机 。 如 果 二 者 都 不 发 生 ， 则 M 将 永 
远 运行 下 去 。 

图 灵机 计算 过 程 中 ， 当 前 状态 、 当 前 带子 内 容 和 读 写 头 当前 位 置 组 合 在 一 起 ， 称 为 图 
灵机 的 格局 (configuration)， 常 以 特殊 方式 表示 。 对 于 状态 g 和 带子 字母 表 了 及 上 的 两 个 字 
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符 串 x 和 wv， 以 uqu 表示 如 下 格局 : 当前 状态 是 9g， 当 前 带子 内 容 是 ww， 读 写 头 的 当前 位 
EE v 的 第 一 个 符号 ， 带 子 上 wv 的 最 后 一 个 符号 
以 后 的 符号 都 是 空白 符 。 例 如 ，10119; 01111 表 
示 如 下 格局 : 当前 带子 内 容 是 101101111， 当 前 [11oTiTiToTiTiTiTiToloTo 
状态 是 gr， 读 写 头 当前 在 第 二 个 0 上 。 图 3-3 示 图 3.3 处 于 格局 10119 01111 的 图 灵机 
意 了 处 于 这 个 格局 的 图 灵机 。 

对 图 灵机 计算 方式 进行 形式 化 ， 如 果 图 灵机 能 合法 地 从 格局 Cl 一 步 进 入 C, ， 则 称 格 
局 Cl 产生 (yields) 格局 C2， 这 个 概念 的 形式 化 定义 如 下 : 

wa, 5b 和 c 是 厂 中 的 符号 , uw 和 w 是 侯 * 中 的 字符 串 ，9 Ma, 是 状态 ， 则 wag;bv 和 
uq acu 是 两 个 格局 。 如 果 转 移 函 数 满足 Og, ,5) 二 (gq;,c,L)， 则 说 

uaq;bv 产生 ug ,acv 
这 说 明了 图 灵机 左 移 的 情形 ， 下 面 是 右 移 情 形 。 如 果 el ,5b) 二 (gq;,c,，R)， 则 说 
uaq,bu 产生 uacq ;v 

当 读 写 头 处 于 格局 的 两 个 端点 之 一 时 ， 会 发 生 特殊 变化 。 对 于 左 端点 ， 如 果 转 移 是 回 
左 移动 ， 则 格局 qiou 产生 格局 gjicz 《因为 不 允许 机 器 从 带子 的 最 左 端 移出 ); 如 果 转 移 是 
向 右 移动 ， 这 个 格局 产生 cgjz。 对 于 右 端点 ， 格 局 uag 等 价 于 vaq;iU， 因 为 已 假设 : 在 市 
子 上 没有 描述 的 部 分 都 是 空格 。 这 样 ， 就 能 像 以 前 一 样 处 理 了 ， 因 为 此 时 读 写 头 已 不 再 处 
Fit FY A Sia o 

M 在 输入 w 上 的 起 始 格 局 (start configuration) 是 格局 go 记 ， 表 示 机 器 处 于 起 始 状态 
qo。， 并 且 读 写 头 处 于 带子 的 最 左 端 位 置 。 在 接受 格局 (accepting configuration) 里 ， 状 态 
是 g,..。,:。 在 拒绝 格局 (rejecting configuration) 里 ， 状 态 是 deject ° 接受 和 拒绝 状态 都 是 
停机 格局 (halting configuration)， 它 们 都 不 再 产生 新 的 格局 。 因 为 机 颖 只 在 接收 或 拒绝 
状态 下 才 停 机 ， 因 此 可 以 等 价 地 将 转移 函数 记 为 6: Q XT>QXTITX1{L,R},， 其 中 Q 是 去 
掉 状 态 goes 与 状态 drejet I QQ。 图 灵机 M 接受 (accept) 输入 w， 如 果 存 在 格局 的 序列 
Cis Coy s+, Cy 使 得 : 

1. Ci 是 M eR A w 上 的 起 始 格 局 ; 

2. 每 一 个 Ci 产生 Cis; 

3. Cy 是 接受 格局 。 

M 接受 的 字符 串 的 集合 称 为 M 的 语言 (language of M), 或 被 M 识别 的 语言 (lan- 
guage recognized by M) ， 记 为 工 CM) 。 

如 果 一 个 语言 能 被 菜 一 图 灵机 识别 ， 则 称 该 语言 是 图 灵 可 识别 的 《Tur- 
ing-recognizable)© 。 l 

在 输入 上 运行 一 个 图 灵机 时 ， 可 能 出 现 三 种 结果 : 接受 、 拒 绝 或 循环 。 这 里 循环 
(loop) 仅仅 指 机 器 不 停机 ， 而 不 一 定 是 这 个 词 的 字面 所 指 的 那样 ， 永 远 以 同样 方式 重复 
同样 的 步骤 。 循 环 动作 可 能 是 简单 的 ， 也 可 能 是 复杂 的 ， 但 都 不 会 导致 停机 状态 。 

对 于 一 个 输入 ， 图 灵机 有 两 种 方式 不 接受 它 : 一 种 是 进入 拒绝 状态 而 拒绝 它 ， 男 一 种 
是 进入 循环 。 有 时 候 ， 很 难 区 分 机 需 是 进入 了 循环 还 是 需要 耗费 长 时 间 的 运行 ， 因 此 ， 我 
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(ESB RMA RAAB ARAL. EMKATM. EA P HAA Fl Eee (decider), 
因为 它们 总 能 决定 是 接受 还 是 拒绝 。 对 于 可 以 识别 某 个 语言 的 判定 右 ， 称 其 判定 (decide) 
该 语言 。 

如 果 一 个 语言 能 被 某 一 图 灵机 判定 ， 则 称 它 是 图 灵 可 判定 的 CTITuring de- 
cidable) ， 简 称 可 判定 的 〈decidable)S 。 

下 面 给 出 一 些 可 判定 语言 的 例子 ， 每 一 个 可 判定 语言 都 是 图 灵 可 识别 的 。 在 第 4 章 ， 
我 们 将 给 出 一 些 图 灵 可 识别 但 不 可 判定 的 语言 例子 。 


3.1.2 图 灵机 的 例子 


像 处 理 有 穷 自 动机 和 下 推 自动 机 那样 ， 为 了 形式 化 地 描述 一 个 特定 图 灵机 ， 可 以 详细 
指明 它 的 七 个 部 分 。 但 除了 最 小 的 机 器 外 ， 这 种 细节 层次 的 描述 对 于 大 多 数 图 灵机 来 说 是 
烦琐 的 ， 所 以 这 里 仅仅 给 出 较 高 层次 的 描述 ， 因 为 这 已 经 足够 精确 ， 并 且 容 易 理解 得 多 。 
注意 ， 需 要 记 住 ， 每 个 较 高 层次 的 描述 实际 上 只 是 它 的 形式 化 描述 的 一 个 速写 ， 只 要 耐心 
和 细致 ， 总 能 形式 化 地 描述 本 书 中 每 个 图 灵机 的 所 有 细 市 。 

为 帮助 你 在 形式 化 描述 和 较 高 层次 描述 之 间 建 立 联系 ， 在 下 面 两 个 例子 中 给 出 状态 
图 。 如 果 熟 悉 这 样 的 联系 ， 可 以 忽略 这 些 图 。 

描述 图 灵机 M: ， 它 判定 的 语言 是 所 有 由 0 组 成 、 长 度 为 2 的 方 寒 的 字符 
+$, B A={02" |n>0}. 

M: 一 “对 于 输入 字符 串 w: 

1. 从 左 往 右 扫 描 整 个 带子 ， 隅 一 个 字符 消去 一 个 0。 

2. 如 果 在 第 1 步 之 后 ， 带 子 上 只 剩 下 唯一 的 一 个 0， 则 接受 。 

3. 如 果 在 第 1 步 之 后 ， 带 子 上 包含 不 止 一 个 0， 并 且 0 的 个 数 是 奇数 ， 则 拒绝 。 
4. 读 写 头 返回 至 带子 的 最 左 端 。 

5. 转 到 第 1 步 。” 

每 重复 一 次 第 1 步 ， 消 去 一 半 个 数 的 0。 由 于 在 第 1 步 中 ， 机 器 扫描 了 整个 带子 ， 故 
它 能 够 知道 它 看 到 的 0 的 个 数 是 奇数 还 是 偶数 。 如 果 是 大 于 1 的 奇数 ， 则 输入 中 所 含 的 0 
的 个 数 不 可 能 是 2 的 方 军 ， 此 时 机 器 就 拒绝 。 但 是 ， 如 果 看 到 的 0 的 个 数 是 1， 则 输入 中 
所 含 的 0 的 个 数 肯定 是 2 TT. UNL aE HS 

下 面 给 出 M2 = (Q52 50050) ,qaccept ，4reect ， 的 形式 化 描述 : 

© Q= {q1 +02 >93 994 995 * accept ? Treject 上， 

e 5= {0}, 

。 T={0,x,U}. 

。 将 9 描述 成 状态 图 CLA 3-4). 

。 开始 、 接 受 和 拒绝 状态 分 别 是 Qi accept A queut。 

在 这 个 状态 图 中 ， 从 gq, 向 q 转移 时 出 现 了 标记 0->L，R。 它 表示 : 当 状 态 为 q BÈS 
头 读 0 时 ， 机 器 的 状态 变 为 g, ， 在 带子 上 当前 位 置 写 下 U， 并 向 右 移动 读 写 头 ， 换 名 话说 ， 
d(q, ,0) 二 (gq, UR). EM q 到 g, 的 转移 中 ， 为 清晰 起 见 ， 使 用 了 简略 记 法 OR, ERM: 





日 ”在 些 课本 称 之 为 递归 语言 。 
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图 3-4 图 灵机 Mz 的 状态 图 


机 需 的 开始 动作 是 : 在 带子 中 第 一 个 0 上 写 下 空 晶 符号， 这样， 在 第 4 步 中 ， 它 将 能 
发 现 带 子 的 左 端点 。 一 般 使 用 更 具有 提示 性 的 符号 〈 如 # ) 作为 左 端点 的 定 界 符 ， 但 这 里 
使 用 空白 符 ， 是 为 了 保持 带子 字母 表 的 规模 较 小 ， 从 而 使 状态 图 保持 较 小 规模 。 例 3. 6 给 
出 了 发 现 带子 的 左 端点 的 另 一 个 方法 。 

我 们 给 出 这 个 机 峰 在 输入 0000 上 运行 的 例子 ， 起 始 格局 是 qi0000。 下 面 是 机 器 所 进 
入 的 格局 序列 ， 应 先 从 上 到 下 再 从 左 到 右 地 读 这 个 序列 。 


q, 0000 U q; x0x U U xq, XX L] 
U q, 000 q; LI x0x U U q; Xxx U 
U xq, 00 U q, X0x U q; U xxx U 
U x0q,0 U xq, 0x U LU g, XXX L 
U x0xq, U U xxq, x U LU xq, xx U 
U x0gs x U LI xxxq, U U xxq, x U 
U xq; 0x U U xxq, x U U xxxq, U 


LI xxx LJ < HRR 


在 本 节 的 开头 ,已 给 出 了 图 灵机 Mi 的 非 形式 化 描述 ， 下 面 给 出 其 形式 化 描 
Æ Mi 一 (Q,z, 了 ,99 qtyqrsect)， 它 判定 的 语言 是 B==(w#w|lwE€ {0,1}*}. 

人 

é S=(0,1,4#)/H r={0,1,#,x,L)}. 

。 用 状态 图 描述 Oo GLA 3-5). 

。 开始 、 接 受 和 拒绝 状态 分 别 是 gj accept FH qiseet。 

图 3- 5 描绘 了 图 灵机 Mi 的 状态 图 ， 其 中 ， 对 于 q; 到 自身 的 转移 ， 你 能 看 到 标记 O, 
1 一 R， 它 表示 当 机 器 在 状态 qg 且 读 0 或 1 时 ， 保 持 状 态 q; 不 动 ， 读 写 头 向 右 移动 。 它 不 
改变 带子 上 的 符号 。 

第 1 步 由 状态 q; 到 9 实现 ， 第 2 步 由 其 余 状 态 实现 。 为 简化 状态 图 ， 没 有 在 图 中 显 
示 拒 绝 状态 ， 也 没有 显示 到 拒绝 状态 的 转移 。 这 种 转移 隐 含 地 意味 着 在 下 列 情 形 下 发 生 : 
一 个 状态 对 某 个 特殊 符号 没有 向 外 的 转移 。 例 如 ， 对 于 状态 ay RAB HH H Sb 
头 ， 因 此 ， 当 状态 为 qg 且 读 写 头 下 的 符号 为 # 时 ， 就 进入 拒绝 状态 deo XTAB 
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图 3-5 图 灵机 Mi 的 状态 图 


函数 ， 如 果 读 写 头 向 右 移 ， 机 器 便 进入 拒绝 状态 。 s 
图 灵机 Ms 做 一 些 初等 算术 ， 它 判定 语言 C= {aibic |iXj=—k, H ij k>}. 
Ms = 二 “对 于 输入 字符 串 ww: 
1. 从 左 往 右 扫描 输入 ， 确 认输 入 具有 形式 af b+ c+ ， 否 则 拒绝 。 
2. 读 写 头 返回 到 带子 的 左 端 点 。 
3. 消去 一 个 a， 并 向 右 扫描 直到 bb 出现。 在 b 与 ec 之 间 来 回 移动 ， 成 对 地 消去 
和 c， 直 到 把 所 有 的 b 都 消去 。 如 果 c 已 经 全 被 消去 后 还 有 b， 则 拒绝 。 
4. 如 果 还 有 a 未 消去 ， 则 恢复 所 有 已 消去 的 b， 再 重复 第 3 步 。 如 果 所 有 的 a 都 
已 被 消去 ， 则 检查 所 有 的 c 是 否 都 已 被 消去 。 如 果 是 则 接受 ， 否 则 拒绝 。” 
现在 仔细 检查 Ms 的 四 个 步骤 。 在 第 1 步 ， 机 器 的 运行 就 像 有 穷 自 动机 一 样 ， 当 读 写 
头 从 左 往 右 移动 时 ， 没 有 必要 去 写 ， 只 要 用 它 的 状态 来 跟踪 输入 字符 串 ， 看 其 是 否 具有 适 
当 的 形式 即 可 。 
步骤 2 似 简 实 妙 。 这 个 图 灵机 怎么 才能 找到 输入 带子 的 左 端点 呢 ? 找到 输入 的 右 端点 
是 容易 的 ， 因 为 输入 以 空白 符 终 止 。 但 开始 时 ， 左 端点 并 没有 终止 符 ， 机 器 发 现 其 带子 左 
端点 的 一 种 方法 是 : 当 读 写 头 从 左 端点 的 符号 开始 运行 时 ， 就 以 某 种 方式 对 这 个 符号 作 个 
标记 ， 这 样 ， 若 机 器 想 要 它 的 读 写 头 回 到 左 端 点 时 ， 就 可 以 向 左 扫 描 直 到 发 现 这 个 记号 。 
例 3. 4 说 明了 这 种 方法 ， 它 以 空白 符 作为 带子 左 端点 的 标记 。 
常常 利用 图 灵机 模型 的 定义 中 提供 的 条 件 来 发 现 带子 左 端点 。 回 忆 一 下 ， 如 果 机 器 试 
图 让 其 读 写 头 移出 带子 的 左 端点 ， 它 就 待 在 原 地 不 动 ， 可 利用 这 个 特点 来 设置 左 端点 探测 
器 。 为 了 探测 读 写 头 是 否 正在 左 端点 上 ， 机 器 可 以 在 当前 位 置 写 下 一 个 特殊 符号 ， 同 时 在 
控制 器 中 记 下 它 取代 的 符号 ， 然 后 试 着 让 读 写 头 向 左 移 。 如 果 它 还 在 这 个 特殊 符号 上 ， 则 
这 次 左 移 没 有 成 功 ， 由 此 可 知 ， 读 写 头 肯 定 在 左 端 点 上 ; 如 果 已 不 在 这 个 特殊 符号 上 ， 而 
在 另 一 个 不 同 的 符号 上 ， 则 带子 上 这 个 位 置 的 左边 肯定 还 有 符号 ， 这 就 完成 了 探测 。 在 进 
一 步 运行 之 前 ， 必 须 保证 已 将 那个 改变 了 的 符号 还 原 为 原来 的 符号 。 
对 于 第 3、4 步 分 别 使 用 不 同 状 态 可 以 直接 实现 它们 。 | ss 
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图 灵机 M4 解 所 谓 的 元 素 区 分 问题 (element distinctness problem) 。 给 出 由 
(0, 1} 组 成 的 字符 串 系 列 ， 字 符 串 之 间 用 符号 # 隔 开 ，M4 的 任务 是 : 如 果 此 序列 中 的 所 
有 字符 串 都 不 同 ， 则 接受 。 此 语言 是 : 

E={#2,#22#°°#2:|2;€ {0,1}* 且 对 任意 基态 有 Er) 
机 器 Ms 将 zl 与 zz 到 zi 进行 比较 ， 然 后 将 zs 与 zs 到 ai HEAT OR, HIRE. Mi 判定 
这 个 语言 的 非 形式 化 描述 如 下 。 

M4 二 “对 于 输入 w: 

1. 在 最 左 端的 带子 符号 的 项 上 做 个 记号 。 如 果 此 带子 符号 是 空白 符 ， 则 接受 。 
如 果 此 符号 是 # ， 则 进行 下 一 步 。 否 则 ， 拒 绝 。 

2. 向 右 扫 描 至 下 一 个 #， 并 在 其 项 上 做 第 二 个 记号 。 如 果 在 过 到 空白 符 之 前 没 
ABAH, WETTERS zl ， 因 此 接受 。 

3. 通过 来 回 移动 ， 比 较 做 了 记号 的 # 的 右边 的 两 个 字符 串 ， 如 果 它 们 相等 ， 则 
拒绝 。 

4. 将 两 个 记号 中 右边 的 那个 向 右 移 到 下 一 # 上 。 如 果 在 碰 到 空白 符 之 前 没有 过 
到 # ， 则 将 左边 的 记号 向 右 移 到 下 一 个 划 上 ， 并 且 将 右边 记号 移 到 后 面 的 # 
上 。 如 果 这 时 右边 记号 还 找 不 到 # ， 则 所 有 的 字符 串 都 已 经 比较 过 了 ， 因 而 
接受 。 

5. 转 到 第 3 步 继 续 执行 。” 

M, 阐述 了 对 带子 符号 做 标记 的 技术 。 在 第 2 步 ， 它 在 一 个 符号 的 项 上 放置 了 一 个 记 
号 〈 本 例 中 ， 这 个 符号 是 #)。 实 际 上 ， 该 机 器 的 带子 字母 表 中 有 两 个 不 同 的 符号 : # 和 


# 。“ 机 器 在 # 顶 上 放置 了 一 个 记号 “. ”的 含义 是 : 它 将 带 有 点 的 # 写 在 这 个 位 置 。“ 把 
这 个 记号 去 掉 ” 的 含义 是 : 机 器 写 下 了 那个 没有 点 的 符号 # 。 一 般 说 来 ， 可 能 需要 在 各 种 
不 同 的 带子 符号 上 做 记号 ， 要 做 到 这 一 点 ， 只 要 带子 字母 表 中 包含 这 些 符号 的 带 点 形式 即 
Fy , s 

从 以 上 这 些 例子 中 可 以 得 出 如 下 结论 : HRMS A, B, CME 都 是 可 判定 的 。 由 
于 每 个 可 判定 语言 都 是 图 灵 可 识别 的 ， 所 以 这 些 语言 都 是 图 灵 可 识别 的 。 而 要 说 明 一 个 语 
言 图 灵 可 识别 但 不 可 判定 ， 则 比较 困难 ， 将 在 第 4 章 中 介绍 。 


3.2 图 灵机 的 变形 


其 他 形式 的 图 灵机 还 很 多 ， 例 如 含有 多 个 带子 的 或 非 确定 性 的 图 灵机 ， 它 们 被 称 为 图 
灵机 模型 的 变形 (variant)， 原 来 的 模型 与 它 所 有 合理 的 变形 有 着 同样 的 能 力 ， 也 即 识别 
相同 的 语言 类 。 本 节 将 描述 这 些 变形 并 证 明 它 们 在 识别 能 力 上 的 等 价 性 。 虽 然 它 们 的 定义 
有 了 变化 ， 但 它们 的 能 力 却 没有 改变 ， 在 形式 变化 中 保持 不 变 的 性 质 称 为 稳健 性 〈robust- 
ness) 。 有 穷 自 动机 和 下 推 自动 机 在 某 种 程度 上 都 是 稳健 的 模型 ， 但 图 灵机 更 具 惊 人 的 稳 
健 性 。 

为 说 明 图 灵机 模型 的 稳健 性 ， 先 对 转移 函数 的 形式 在 允许 范围 内 做 小 改动 。 在 原来 的 
定义 中 ， 转 移 函 数 强迫 读 写 头 在 每 一 步 之 后 都 要 回 左 或 回 右 移动 ， 不 能 仅仅 待 厦 不 动 ， 如 
果 人 允许 图 灵机 读 写 头 有 保持 不 动 的 能 力 ， 则 转移 函数 应 有 如 下 的 形式 : 6: QXT>QXTX 
{L,R,S}。 这 个 特点 能 否 使 图 灵机 人 能够 识别 更 多 的 语言 呢 ? 也 即 能 否 增 强 它 的 识别 能 力 


IÈ LF-HRCM 111 


We? 当然 不 能 ， 因 为 我 们 能 将 任何 具有 这 个 特点 的 图 灵机 转变 为 一 个 没有 这 个 特点 的 图 灵 
机 ， 做 法 是 : 用 两 个 转移 替代 每 一 个 “ 待 着 不 动 ” 的 转移 ， 第 一 个 是 向 右 移动 ， 第 二 个 是 
回 左 返回 。 

这 个 例子 包含 了 证 明 各 种 变形 图 灵机 之 间 等 价 性 的 关键 : 为 证 明 两 个 模型 是 等 价 的 ， 
只 要 证 明 它 们 能 相互 模拟 即 可 。 


3.2.1 多 市 图 灵机 


多 带 图 灵机 (multitape Turing machine) 很 像 普 通 图 录 机 ， 只 是 有 多 个 带子 ， 每 个 囊 
子 都 有 自己 的 读 写 头 ， 用 于 读 和 写 。 开 始 时 ， 输 入 出 现在 第 一 个 带子 上 ， 其 他 的 带子 都 是 
空白 的 。 转 移 函 数 改 为 允许 多 个 带子 同时 进行 读 、 写 和 移动 读 写 头 ， 其 形式 为 : 

区 关 人 = 和 区 (Lo 天 
此 处 & 是 带子 的 个 数 。 表 达 式 
OCG; 91 9°88 Qe) = (q; 91 >*t ,bk Ls Raes la) 
指 的 是 : 若 机 器 处 于 状态 q ESA 1 到 所 读 的 符号 分 别 是 al Bla, MELA F ARK 
态 gq;， 各 读 写 头 分 别 写 下 符号 b 到 b， 并 按 此 式 所 指示 的 那样 移动 每 个 读 写 头 。 

多 带 图 灵机 看 上 去 比 普 通 图 灵机 的 能 力 强 ， 但 可 以 证 明 它 们 是 等 价 的 。 回 忆 一 下 : A 
两 个 机 器 识别 相同 的 语言 ， 则 它们 是 等 价 的 。 

每 个 多 带 图 灵机 等 价 于 某 一 个 单 带 图 灵机 。 

证 明 将 一 个 多 带 图 灵机 M 转换 为 一 个 与 之 等 价 的 单 带 图 灵机 S， 关 键 是 怎样 用 S 来 
模拟 M., 

假设 M 有 个 带子 ，S 把 此 & 个 带子 的 信息 都 存储 在 它 的 唯一 带子 上 ， 并 以 此 来 模拟 下 
个 带子 的 效果 。 它 用 一 个 新 的 符号 # 作 为 定 界 符 ， 以 分 开 不 同 带子 的 内 容 。 除 了 带子 内 容 之 
外 ，S 还 必须 记录 每 个 读 写 头 的 位 置 。 为 此 ， 它 在 一 个 符号 的 项 上 加 个 点 ， 以 此 来 标记 读 写 
头 在 其 带子 上 的 位 置 ，S 把 它们 想象 为 虚拟 带子 和 虚拟 读 写 头 。 像 以 前 一 样 ， 加 点 的 带子 符 
号 应 是 已 经 加 进 带 子 字母 表 的 新 符号 。 图 3- 6 说 明了 怎样 用 一 个 带子 来 表示 三 个 带子 。 





S 
s #|olilolilol#lalalal#|b|l al#lu|... 


图 3-6 用 一 个 带子 来 表示 三 个 带子 


S 二 “对 于 输入 w= w w: 
1. S 在 自己 的 带子 上 放 和 人 
H ww wn HUHUH e H 
此 格式 表示 了 M 的 全 部 & 个 带子 的 内 容 。 
2. 为 了 模拟 多 带 机 的 一 步 移动 ，S 在 其 带子 上 从 标记 左 端 点 的 第 一 个 # 开 始 扫 
描 ， 一 直 扫 描 到 标记 右 端点 的 第 (& 十 1) 个 共 ， 其 目的 是 确定 虚拟 读 写 头 下 
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的 符号 。 然 后 S 进行 第 二 次 扫描 ， 并 根据 M 的 转移 函数 指示 的 运行 方式 更 新 
eet 

3. 任何 时 候 ， 只 要 S 将 某 个 虚拟 读 写 头 向 右 移动 到 某 个 # 上 面 ， 就 意味 着 M 已 将 
自己 相应 的 读 写 头 移动 到 了 其 所 在 的 带子 中 的 空白 区 域 上 ， 即 以 前 没有 读 过 的 
区 域 上 。 因 此 ，S 在 这 个 带子 方 格 上 写 下 空白 符 ， 并 将 这 个 带子 方 格 到 最 右 端的 
各 个 带子 方 格 中 的 内 容 都 向 右 移动 一 格 。 然 后 再 像 之 前 一 样 继续 模拟 。” * 

一 个 语言 是 图 灵 可 识别 的 ， 当 且 仅 当 存 在 多 带 图 灵机 识别 它 。 
证 明 一 个 图 灵 可 识别 语言 可 由 一 个 普通 的 ( 单 带 ) 图 灵机 识别 ， 这 个 普通 图 灵 
机 是 多 带 图 灵机 的 一 个 特例 ， 这 就 证 明了 此 推论 的 一 个 方向 。 另 一 个 方向 可 由 定理 
3.8 得 证 。 所 


3.2.2 非 确定 型 图 灵机 


非 确定 型 图 灵机 有 如 其 名 : 在 计算 过 程 中 ， 机 器 可 以 在 多 种 可 能 性 动作 中 选择 一 种 继 

续 进 行 。 它 的 转移 函数 具有 如 下 形式 : 

FAXT =P OXX (LR) 
其 计算 是 一 棵 树 ， 不 同 分 支 对 应 着 机 器 不 同 的 可 能 性 动作 。 如 果 计 算 的 某 个 分 支 导致 接受 
状态 ， 则 机 器 接受 该 输入 。 如 果 需 要 复习 非 确定 性 ， 参 看 1. 2 节 ， 现 在 证 明 非 确定 性 不 会 
影响 图 灵机 模型 的 识别 能 力 。 

GEER 年 个 非 确定 型 图 灵机 都 等 价 于 某 一 个 确定 型 图 灵机 。 

证 明 思路 ”用 确定 型 图 灵机 DD 来 模拟 非 确定 型 图 灵机 N 的 证 明 思 路 是 : 让 DD 试验 N 
的 非 确定 型 计算 的 所 有 可 能 分 支 。 若 DD 能 在 某 个 分 支 到 达 接 受 状态 ， 则 接受 ; 否则 DD 的 
模拟 将 永 不 终止 。 

将 N 在 输入 w 上 的 计算 看 作 一 棵 树 ， 树 的 每 个 分 支 代表 非 确定 型 图 灵机 的 一 个 分 支 ， 
结 点 是 N 的 一 个 格局 ， 根 是 起 始 格局 ， 图 灵机 D 在 这 棵 树 上 搜索 接受 格局 。 仔 细 地 引导 
搜索 是 非常 重要 的 ， 以 免 D 不 能 访问 整 棵 树 。 一 个 诱 人 〈 但 是 坏 ) 的 想法 是 : DD 使 用 
“深度 优先 ”策略 搜索 此 树 ， 这 种 搜索 需要 记录 下 其 搜索 的 某 个 分 支 下 的 所 有 子 分 支 ， 然 
后 再 转 去 搜索 另 一 个 分 支 。 如 果 这 样 ，D 有 可 能 要 记录 一 个 无 限 分 支 ， 因 而 要 无 限 记录 下 
去 ， 也 就 不 能 发 现在 其 他 分 支 上 的 接受 格局 。 为 此 我 们 采用 “宽度 优先 ”策略 搜索 整 棵 
树 ， 这 个 策略 是 : 在 搜索 一 个 深度 内 的 所 有 分 支 之 后 ， 再 去 搜索 下 一 个 深度 内 的 所 有 分 
支 。 此 方法 能 保证 D 可 以 访问 树 的 所 有 结 点 ， 直 到 它 遇 到 接受 格局 。 

证 明 ”模拟 确定 型 图 灵机 D 有 三 个 带子 ， 根 据 定理 3. 8， 这 等 价 于 只 有 一 个 带子 。 机 
器 D 将 这 三 个 带子 用 于 专门 用 途 。 见 图 3- 7。 第 一 个 带子 只 包含 输入 串 ， 且 不 再 改变 ; 第 
二 个 带子 存放 N 的 带子 中 的 内 容 ， 此 内 容 对 应 N 的 非 确定 型 计算 的 某 个 分 支 ; 第 三 个 带 
子 记录 DEN 的 非 确定 型 计算 树 中 的 位 置 。 

首先 考虑 第 三 个 带子 上 表示 的 数据 。 
N 的 每 个 格局 确定 一 个 集合 ， 它 是 由 此 
格局 可 能 转移 到 的 所 有 下 一 格局 组 成 ， 这 
些 下 一 格局 是 由 N 的 转移 函数 指定 的 。 
N 的 非 确定 型 计算 中 的 每 个 结 点 最 多 有 8 o 地 址 带 


个 子 结 点 ， 其 中 b 是 上 述 集合 中 最 大 的 集 3-7 确定 型 图 灵机 DD 模拟 非 确定 型 图 灵机 N 
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合 所 含 的 元 素 个 数 。 对 树 的 每 个 结 点 ， 可 以 给 其 分 配 一 个 地 址 ， 它 是 字母 表 也 一 (1,2,…， 
b) 上 的 一 个 串 。 例 如 ， 把 地 址 231 分 配给 按 以 下 方式 到 达 的 结 点 : 从 根 出 发 走 到 它 的 第 
二 个 子 结 点 ， 再 由 此 走 到 第 三 个 子 结 点 ， 最 后 由 此 走 到 第 一 个 子 结 点 。 此 串 中 的 数字 告诉 
我 们 : 在 模拟 N 的 非 确定 型 计算 的 一 个 分 支 时 下 一 步 应 做 什么 。 如 果 一 个 格局 拥有 的 选择 
太 少 ， 则 一 个 符号 可 能 不 对 应 任何 选择 ， 此 种 情况 下 ， 地 址 将 无 效 ， 不 对 应 任何 结 点 。 第 三 
个 市 子 上 包含 也 上 的 一 个 串 ， 它 代表 N 的 计算 树 中 的 如 下 分 支 : 起 点 是 根 ， 终 点 是 此 串 表 
示 的 地 址 所 对 应 的 结 点 ， 除 非 这 个 地 址 是 无 效 的 。 空 串 是 树 根 地 址 。D 的 描述 如 下 : 

1. 开始 时 ， 第 一 个 带子 包含 输入 w， 第 二 和 第 三 个 带子 都 是 空 的 。 

2. 把 第 一 个 汕 子 复制 到 第 二 个 带子 上 ， 并 将 第 三 个 带子 的 字符 串 初始 化 为 e。 

3. 用 第 二 个 带子 去 模拟 N 在 输入 w 上 的 非 确定 型 计算 的 某 个 分 支 。 在 NN 的 每 一 步 动 
作 之 前 ， 查 询 第 三 个 带子 上 的 下 一 个 数字 ， 以 决定 在 N 的 转移 函数 所 允许 的 选择 中 作 何 
选择 。 如 果 第 三 个 带子 上 没有 符号 剩 下 ， 或 这 个 非 确 定型 的 选择 是 无 效 的 ， 则 放弃 这 个 分 
支 ， 转 到 第 4 步 。 如 果 遇 到 拒绝 格局 也 转 到 第 4 步 。 如 果 遇 到 接受 格局 ， 则 接受 这 个 
输入 。 

4. 在 第 三 个 带子 上 ， 用 字符 串 顺 序 的 下 一 个 串 来 蔡 代 原 有 的 串 。 转 到 第 2 步 ， 以 模拟 


N 的 计算 的 下 一 个 分 支 。 = 
CTED 一 个 语言 是 图 灵 可 识别 的 ， 当 且 仅 当 存 在 非 确定 型 图 灵机 识别 它 。 
证 明 ”确定 型 图 灵机 自然 是 一 个 非 确定 型 图 灵机 ， 此 推论 的 一 个 方向 由 此 立刻 得 证 。 

另 一 个 方 回 可 由 定理 3. 10 得 证 。 器 


可 以 修改 定理 3. 10 的 证 明 ， 使 得 如 果 NN 在 计算 的 所 有 分 支 上 都 能 停机 ， 则 DD 也 总 能 
停机 。 如 果 对 所 有 输入 所 有 分 支 都 停机 ， 则 称 这 个 非 确 定型 图 灵机 是 一 个 判定 器 (decid- 
er), AY 3. 3 要 求 以 这 种 方式 修改 此 证 明 ， 以 得 到 定理 3. 10 的 下 列 推论 。 

《ES 萝 ”一 个 语言 是 可 判定 的 ， 当 且 仅 当 存 在 非 确定 型 图 灵机 判定 它 。 


3.2.3 MÆR 
前 面 的 脚注 曾经 提 到 ， 有 人 使 用 术语 递归 可 枚 举 语言 来 代替 图 灵 可 识别 语言 。 这 个 术 


语 起 源 于 称 为 枚 举 器 (enumerator) 的 机 器 ， 它 是 图 灵机 的 一 种 变形 。 概 略 地 说 ， 枚 举 器 
是 带 有 打印 机 的 图 灵机 ， 图 灵机 把 打印 机 当 作 输出 设备 ， 从 而 可 以 打印 串 。 每 当 图 灵机 想 
在 打印 序列 中 增加 一 个 串 时 ， 就 把 此 串 送 到 打印 机 。 练 习 3.4 要 求 给 出 枚 举 器 的 形式 定 
义 。 图 3-8 给 出 了 这 个 模型 的 示意 图 。 和 
HR E 以 空白 输入 的 工作 带 开始 运行 ， 如 Us 
果 不 停机 ， 它 可 能 会 打印 出 串 的 一 个 无 限 序列 。 ee 
枚 举 器 E 所 枚 举 的 语言 是 最 终 打印 出 的 串 的 集合 ， 
而 且 玉 可 能 以 任意 顺序 生成 这 个 语言 中 的 串 ， 其 7 
EMAAR. FE AE sk A R R a R aE 图 3-8 枚 举 器 的 示意 图 
言 间 的 联系 。 
GERED 一 个 语言 是 图 灵 可 识别 的 ， 当 且 仅 当 存在 枚 举 器 枚 举 它 。 
证 明 首先 证 明 : 如 果 有 枚 举 器 巨 枚 举 语言 A， 则 有 图 灵机 M 识别 A。 图 灵机 M 按 
如 下 方式 运行 : 
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M 一 “对 于 输入 Ws 
lL 运行 也 每 当 五 和 输出 一 个 串 时 ， 将 之 与 三 比较 。 
2. WR w 曾经 在 五 的 输出 中 出 现 过 ， 则 接受 。” 
TR. MÈZE E 的 输出 序列 中 出 现 过 的 那些 串 。 
现在 证 明 另 一 个 方向 。 设 51,s2,53，… 是 上 x* PRA A REN BS, MRA RB M 识别 
WRA, MA A 构造 枚 举 器 玉 如 下 : 
FF 二 “忽略 输入 。 
1. 对 ;=1,2,3，…， 重 复 下 列 步骤。 
2. 对 51 ,52，… ,5i 中 的 每 一 个 ，M 以 其 作为 输入 运行 i 步 。 
3. 如 果 有 计算 接受 ， 则 打印 出 相应 的 sjo” 
如 果 M 接受 串 ;， 它 终 将 出 现在 玉生 成 的 打印 列表 中 。 事 实 上 ， 它 将 在 此 列表 中 出 现 
无 限 多 次 ， 因 为 每 一 次 重复 步骤 1，M 在 每 一 个 串 上 都 从 头 开始 运行 。 这 个 过 程 有 使 M 在 
所 有 可 能 的 输入 上 并 行 运行 的 效果 。 i 


3.2.4 与 其 他 模型 的 等 价 性 


至 此 ,已 经 介绍 了 图 灵机 的 多 种 变形 ， 并 证 明了 它们 在 能 力 上 是 等 价 的 。 人 们 还 提出 
了 许多 其 他 的 通用 计算 模型 ， 其 中 的 一 些 与 图 灵机 十 分 相似 ， 而 另 一 些 则 相差 甚 远 ， 但 都 
具有 图 灵机 的 本 质 特征 ， 即 可 以 无 限制 地 访问 无 限 的 存储 船 ， 这 个 特征 把 它们 和 有 穷 自 动 
机 、 下 推 自 动机 等 能 力 较 弱 的 模型 区 别 开 来 。 值 得 注意 的 是 ， 已 经 证 明 : 具有 此 特点 的 所 
有 模型 在 能 力 上 都 是 等 价 的 ， 只 要 它们 满足 一 些 合理 的 必要 条 件 即 可 9 。 

为 理解 这 种 现象 ， 考 虑 程序 设计 语言 中 的 类 似 情形 。 许 多 程序 设计 语言 〈 如 Pascal 和 
LISP) 从 类 型 和 结构 上 看 ， 它 们 相去 其 远 ， 那 么 一 个 算法 是 否 只 能 在 其 中 一 个 上 执行 而 不 
能 在 另 一 个 上 执行 呢 ? 当然 不 是 ， 我 们 既 能 将 LISP 编译 到 Pascal， 也 能 将 Pascal 编译 到 
LISP， 这 意味 着 两 个 语言 描述 了 完全 相同 的 算法 类 ， 其 他 合理 的 程序 设计 语言 也 是 一 样 。 
计算 模型 间 的 普遍 等 价 性 也 基于 完全 同样 的 原因 ， 任 意 两 个 满足 合理 条 件 的 计算 模型 都 能 
相互 模拟 ， 从 而 在 能 力 上 是 等 价 的 。 

这 种 等 价 现象 有 着 重要 的 哲学 内 涵 ， 虽 然 计 算 模型 是 多 种 多 样 的 ， 但 它们 所 描述 的 算 
法 类 只 有 一 个 。 单 个 计算 模型 的 定义 有 一 定 的 随意 性 ， 但 从 根本 上 说 它 所 描述 的 算法 类 是 
自然 的 ， 因 为 它 和 其 他 模型 所 描述 的 类 是 一 样 的 。 这 种 现象 对 于 数学 也 有 深远 的 意义 ， 下 
一 市 将 对 此 进行 说 明 。 


3.3 算法 的 定义 


非 形式 化 地 说 ， 鼻 法 是 为 实现 某 个 任务 而 构造 的 简单 指令 集 。 在 日 常用 语 中 ， 算 法 有 
时 称 为 过 程 或 处 方 。 算 法 在 数学 中 也 起 着 重要 的 作用 ， 古 代数 学 文献 中 包含 了 各 种 各 样 任 
务 的 算法 描述 ， 如 寻找 素数 和 最 大 公 因 子 、 在 当代 数学 中 ， 更 是 充满 了 算法 。 

虽然 算法 在 数学 中 已 有 很 长 的 历史 ,但 在 20 世纪 之 前 ， 算 法 概念 本 身 一 直 没 有 精确 
的 定义 。 当 时 的 数学 家 对 下 述 问题 只 有 直观 的 认识 : 什么 是 算法 ? 在 使 用 和 描述 算法 时 应 
依赖 什么 ? 这 种 直观 认识 对 深入 理解 算法 是 不 够 的 。 下 面 的 故事 说 明了 算法 的 精确 定义 对 


日 例如 ,“ 在 一 步 中 只 能 执行 有 限 的 工作 量 ” 就 是 这 样 一 个 条 件 。 
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一 个 重要 数学 问题 是 多 么 的 关键 。 


3.3.1 和 希 尔 伯 特 问 题 


1900 年 ， 数 学 家 和 硕 尔 伯 特 在 巴黎 举行 的 世界 数学 家 大 会 上 发 表 了 至 今 仍然 著名 的 演 
说 。 在 演说 中 ， 他 提出 了 23 个 数学 问题 ， 并 认为 它们 是 对 下 一 个 世纪 的 挑战 ， 其 中 的 第 
10 个 问题 就 是 关于 算法 的 。 

在 描述 这 个 问题 之 前 ， 先 简单 讨论 多 项 式 〈polynomial) 。 一 个 多 项 式 是 一 些 项 (term) 
的 和 ， 其 中 每 个 项 都 是 一 个 常数 和 一 些 变 元 的 积 ， 常 数 称 为 系数 (coefficient), pila, 

6e.xz°*°Tz*X*y* ze* z=67x’ yz? 
是 一 个 项 ， 其 系数 是 6; 又 如 ， 
62° yr dry — r — 10 
是 一 个 多 项 式 ， 它 有 四 个 项 和 三 个 变 元 zx、y 和 xz。 本 节 讨 论 中 ， 只 考虑 系数 是 整数 的 多 
项 式 。 多 项 式 的 一 个 根 (root) 是 对 它 的 变 元 的 一 个 赋值 ， 使 得 此 多 项 式 的 值 为 0。 上 述 
多 项 式 的 一 个 根 是 x 二 5，y 二 3 和 zx 一 0， 这 个 根 是 个 整数 根 Cintegral root) ， 因 为 所 用 的 
变 元 都 被 赋予 整数 值 。 有 些 多 项 式 有 整数 根 ， 有 些 则 没有 。 

名 尔 伯 特 第 10 问题 旨 在 设计 一 个 算法 来 检测 一 个 多 项 式 是 否 有 整数 根 。 他 没有 用 算 
法 这 个 术语 ， 而 是 用 这 样 一 句 短语 :“ 通 过 有 限 多 次 运算 就 可 以 决定 的 过 程 >85 。 有 意思 的 
是 ， 从 希 尔 伯 特 对 这 个 问题 的 陈述 中 可 以 看 出 ， 他 明确 地 要 求 设计 一 个 算法 ， 因 此 ， 他 明 
显 地 假设 这 样 的 算法 存在 ， 人 们 所 要 做 的 只 是 找到 它 。 

现在 我 们 知道 ， 这 个 任务 没有 算法 ， 它 在 算法 上 是 不 可 解 的 。 但 对 于 那个 时 期 的 数学 
家 来 说 ， 以 他 们 对 算法 的 直观 认识 ， 得 出 这 样 的 结论 是 不 可 能 的 。 这 个 直观 概念 也 许 适 用 
于 给 出 一 些 任 务 的 算法 ， 但 奉 将 之 用 于 证 明 某 个 特定 任务 的 算法 不 存在 ， 就 毫 无 用 处 了 。 
证 明 算法 不 存在 需要 给 出 算法 的 明确 的 定义 ， 第 10 问题 的 进展 必须 等 竺 这样 的 定义 。 

在 丘 奇 (Alonzo Church) MAIR (Alan Turing) F 1936 年 写 的 文章 中 ， 这 样 的 定义 
终于 被 给 出 。 丘 奇 使 用 称 为 和 -演算 的 记号 系统 来 定义 算法 ， 图 灵 使 用 机 器 来 做 同样 的 事 
情 。 这 两 个 定义 后 来 被 证 明 是 等 价 的 ， 算 法 的 非 形式 化 概念 和 精确 定义 之 间 的 这 个 联系 从 
此 被 称 为 丘 奇 -图 灵 论 题 (Church-Turing thesis)， 如 图 3- 9 Pra. 


算法 的 直观 概念 等 于 图 灵机 算法 
图 3-9 上 丘 奇 -图 灵 论 题 


丘 奇 -图 灵 论 题 提出 的 算法 定义 是 解决 希 尔 伯 特 第 10 问题 所 必需 的 。1970 年 ， 马 提 亚 
塞 维 齐 (Yuri Matijasevic) 在 戴 维 斯 (Matin Davis) 、 普 特 纳 姆 (Hilary Putnam) AE 
# (Julia Robinson) 等 人 工作 的 基础 上 , 证 明了 检查 多 项 式 是 否 有 整数 根 的 算法 是 不 存 
在 的 。 第 4 章 将 介绍 一 种 技术 ， 它 可 以 被 用 来 证 明 这 个 结论 及 证 明 另 外 一 些 问题 也 是 算法 
上 不 可 解 的 。 

现在 用 上 述 术 语 来 重新 陈述 希 尔 伯 特 第 10 问题 ， 这 样 做 有 助 于 一 些 论题 的 引入 ， 这 
些 论题 将 在 第 4 章 和 第 5 章 中 讨论 。 设 


CO 从 德语 原文 翻译 。 
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D={plp 是 有 整数 根 的 多 项 式 } 
本 质 上 ， 和 硕 尔 伯 特 第 10 问题 是 问 : 集合 D 是 不 是 可 判定 的 ? 答案 是 否定 的 。 作 为 比较 ， 
先 证 明 D 是 图 灵 可 识别 的 。 在 证 明之 前 ， 先 讨论 一 个 简单 问题 ， 它 与 希 尔 伯 特 第 10 问题 
非常 类 似 ， 所 不 同 的 是 现在 仅 考虑 只 有 一 个 变 元 的 多 项 式 ， 如 4r? — 2r? 十 z 一 7。 设 
Di={plp EA BRR zt 的 多 项 式 )} 

下 面 是 识别 Di 的 图 灵机 Mi : 

Mi 二 “输入 是 关于 变 元 z 的 一 个 多 项 式 p。 

1. 当 工 相继 被 设置 为 值 0，1， 一 1，2， 一 2，3， 一 3，… 时 ， 求 p 的 值 。 一 旦 
求 得 p 二 0， 就 接受 。” 

WR p 有 整数 根 ，Mi 最 终 将 找到 它 ， 从 而 接受 ; WR p 没有 整数 根 ， 则 M 将 永远 
运行 下 去 。 对 于 多 个 变 元 的 情形 ， 可 以 设计 一 个 类 似 的 图 灵机 M 来 识别 DD， 只 是 M 要 检 
查 多 个 变 元 所 有 可 能 取 的 整数 值 。 

Mi 和 M 都 是 识别 器 而 非 判 定 器 。Mi 可 以 被 转换 成 Di 的 判定 器 ， 因 为 可 以 算出 一 个 
上 界 ， 使 得 一 个 单 变 元 的 所 有 根 都 在 这 个 上 界 内 ， 这 样 ， 只 要 在 这 个 上 界 以 内 进行 搜索 即 
可 。 在 问题 3. 10 中 要 求证 明 : 一 个 多 项 式 的 根 一 定 在 下 列 值 之 间 


+h C max 


C] 
其 中 是 此 多 项 式 中 项 的 个 数 ，cmax 是 绝对 值 最 大 的 系数 ，c1l 是 最 高 次 项 的 系数 。 如 果 在 
这 个 上 界 内 找 不 到 根 ， 则 机 峰 就 拒绝 。 马 提 亚 塞 维 齐 (Matijasevisc) 定理 表明 : 对 于 多 
变 元 多 项 式 ， 计 算 这 样 的 上 界 是 不 可 能 的 。 


3.3.2 描述 图 灵机 的 术语 


现在 到 了 计算 理论 研究 的 转折 点 。 讨 论 对 象 还 是 图 灵机 ， 但 从 现在 起 ， 真 正 焦 点 是 算 
法 ， 而 图 灵机 只 是 被 用 作 算法 定义 的 一 个 精确 模型 。 我 们 将 忽略 图 灵机 本 身 的 广博 理论 ， 
也 不 过 多 地 浪费 时 间 在 图 灵机 的 低层 次 程序 设计 上 。 我 们 只 需要 相信 图 灵机 刻画 了 所 有 的 
算法 。 

在 承认 这 一 点 的 前 提 下 ， 下 面 将 图 灵机 算法 的 描述 方式 标准 化 。 在 研究 开始 时 ， 人 们 
总 要 问 : 在 描述 算法 时 ， 什 么 样 的 详细 程度 是 适当 的 ? 学 生 通 常 也 会 问 这 样 的 问题 ， 特 别 
在 他 们 准备 着 手 解 题 和 做 练习 时 更 会 这 样 问 。 描 述 的 详细 程度 有 三 种 : 第 一 种 是 形式 化 描 
述 ， 即 详尽 地 写 出 图 灵机 的 状态 、 转 移 函 数 等 ， 这 是 最 低层 次 、 最 详细 程度 的 描述 ， 第 二 
种 描述 的 抽象 水 平 要 高 一 些 ， 称 为 实现 描述 ， 这 种 方法 使 用 日 常 语 言 来 描述 图 灵机 的 动 
作 ， 如 怎么 移动 读 写 头 、 怎 么 在 带子 上 存储 数据 等 ， 这 种 程度 的 描述 没有 给 出 状态 和 转移 
AANA; 第 三 种 是 高 层次 描述 ， 它 也 是 使 用 日 常 语言 来 描述 算法 ， 但 忽略 了 实现 的 细 
他 ， 这 种 程度 的 描述 不 再 需要 提 及 机 器 如 何 管理 它 的 带子 或 读 写 头 。 

本 章 已 经 给 出 了 许多 图 灵机 的 描述 ， 它 们 都 是 形式 化 描述 或 实现 描述 的 例子 。 使 用 较 
低层 次 的 图 灵机 进行 描述 有 助 于 理解 图 灵机 并 增强 使 用 它们 的 信心 ， 一 旦 有 了 这 样 的 信 
心 ， 就 足以 进行 高 层次 描述 。 

下 面 描述 图 灵机 的 格式 和 记号 。 图 灵机 的 输入 总 是 一 个 串 ， 如 果 想 以 一 个 对 象 而 不 是 
字符 串 作 为 输入 ， 必 须 先 将 那个 对 象 字 符 串 化 。 串 能 很 容易 地 表达 多 项 式 、 图 、 文 法 、 自 
动机 及 这 些 对 象 的 任意 组 合 。 可 以 设计 一 个 图 灵机 来 对 这 些 串 进行 适当 的 解码 ， 使 之 被 解 


PIÈ LAF-HRtM 117 


释 为 所 希望 的 对 象 。 对 象 O 编码 成 字符 串 的 记号 是 〈O0) ， 如 果 有 多 个 对 象 O, Oz, Ors 
它们 的 编码 是 一 个 串 ， 记 为 〈O ,O* ,…,Ox) 。 可 用 多 种 合理 的 方式 进行 编码 ， 选 择 哪 一 
种 并 不 重要 ， 因 为 图 灵机 总 能 将 一 种 编码 转化 成 另 一 种 。 
描述 图 灵机 算法 的 格式 是 带 引号 的 文字 段 ， 且 排 成 锯齿 形状 。 将 算法 分 成 几 个 步骤 ， 
每 个 步 又 可 能 包括 图 灵机 计算 的 许多 步 ， 用 更 深 的 缩 进 方式 来 指示 算法 的 分 块 结构 。 算 法 
的 第 一 行 描述 机 器 的 输入 ， 如 果 输 入 描述 仅仅 被 写成 w， 则 这 个 串 就 被 当 作 输 入 。 如 果 输 
入 描述 的 是 一 个 对 象 的 编码 〈A，， 则 暗示 图 灵机 需要 首先 检查 此 输入 是 否 确 实 是 所 要 的 
对 象 的 编码 ， 如 果 不 是 ， 则 拒绝 它 。 
GERD 设 A 是 由 表示 连通 无 向 图 的 串 构成 的 语言 。 回 忆 一 下 ， 如 果 一 个 图 从 任意 
顶点 出 发 都 可 以 沿 着 边 走 到 其 他 所 有 顶点 ， 则 称 这 个 图 是 连通 的 (connected), iW AW 
A 二 {(G)|G 是 连通 无 向 图 ) 
下 面 是 判定 A 的 图 灵机 M 的 一 个 高 层次 描述 : 
M= 二 “输入 是 图 G 的 编码 (G): 
1. 选择 G 的 第 一 个 顶点 ， 并 标记 之 。 
2. 重复 下 列 步骤， 直到 没有 新 的 顶点 可 作 标 记 。 
3. 对 于 G 的 每 一 个 顶点 ， 如 果 能 通过 一 条 边 将 其 连 到 另 一 个 已 被 标记 的 顶点 ， 
则 标记 该 顶点 。 
4. 扫描 G 的 所 有 顶点 ， 确 定 它们 是 否 都 已 作 了 标记 。 如 果 是 ， 则 接受 ， 否 则 
拒绝 。” 
作为 附加 练习 ， 下 面 检查 图 灵机 M 的 一 些 实现 细节 。 今后 一 般 不 给 出 这 些 细节 ， 也 
没有 必要 这 样 做 ， 除 非 有 这 样 的 明确 要 求 。 首 先 ， 必 须 了 解 “G〉 是 怎样 将 图 G 编码 成 一 
个 串 的 。 考 虑 如 下 的 编码 方式 ; 先是 G 的 顶点 序列 ， 后 面 紧 跟 G 的 边 序列 。 顶 点 由 一 个 
十 进 制 数 表示 ， 边 由 一 对 表示 它 的 两 个 端点 的 十 进 制 数 表示 。 图 3- 10 描绘 了 这 样 一 个 图 
和 它 的 编码 。 


(G)= (1, 2, 3, 4)((1, 2), (2, 3), (3, 1), (1, 4) 





图 3-10 图 G 和 它 的 编码 (G) 


当 M 收 到 输入 〈“G〉 时 ， 立 即 对 其 进行 检查 ， 以 确定 它 是 否 是 某 个 图 的 正确 编码 。 为 
此 ，M 首先 扫描 市 子 ， 确 定 是 否 有 两 个 序列 ， 并 检查 它们 的 格式 是 否 都 正确 。 第 一 个 序列 
应 该 是 不 相同 的 十 进 制 数 的 序列 ， 第 二 个 序列 应 该 是 十 进 制 数 对 的 序列 。 然 后 M 检查 以 
下 两 项 : 顶点 序列 应 该 不 包含 重复 元 素 ; 出 现在 边 序列 中 的 每 个 顶点 也 应 该 出 现在 顶点 序 
列 中 。 对 于 前 一 项 ， 可 以 使 用 例 3. 7 给 出 的 图 灵机 M 来 检查 元 素 是 否 不 同 ， 并 用 类 似 的 
方法 实现 对 第 二 项 的 检查 。 如 果 输 入 通过 了 这 些 检查 ， 它 就 是 某 个 图 的 编码 。 完 成 了 对 输 
和 人 的 检查 后 ，M 继续 运行 ， 并 进入 第 1 步 。 

对 于 第 1 步 ，M 在 最 左 端的 数字 上 加 个 点 来 对 第 一 个 顶点 作 标 记 。 
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对 于 第 2 步 ，M 扫描 顶点 序列 以 发 现 一 个 未 加 点 的 顶点 n1， 并 以 男 一 种 方法 对 其 进 
行 标 记 ， 比 如 说 ， 在 它 的 第 一 个 符号 下 画 一 条 线 。 然 后 ，M 再 次 扫描 顶点 序列 来 发 现 一 个 
已 带 点 的 顶点 maz ， 并 在 其 下 划 线 。 

然后 M 扫描 边 序 列 。 对 于 每 一 个 边 ，M 检查 那 两 个 带 下 划 线 的 顶点 nl Alm, BH 
否 在 这 条 边 中 出 现 。 如 果 是 ， 则 M En 上 加 点 ， 并 去 掉 其 下 划 线 ， 再 回 到 第 2 步 的 开头 ， 
然后 继续 运行 。 如 有 果 不 是 ， 则 M 检查 边 序列 中 的 下 一 个 边 ， 如 果 没 有 多 余 的 边 ， 则 {ni， 
n) 不 是 G 的 边 。 然 后 它 把 nz 下 划 线 移动 到 下 一 个 带 点 的 顶点 上 ， 现 在 称 这 个 顶点 为 n. 
再 重复 本 段 中 的 步骤 ， 并 像 以 前 一 样 检 查 这 个 新 的 对 {nm ,ns) 是 否 是 一 条 边 。 如 果 已 没 
有 多 余 的 带 点 的 顶点 ， 则 mn 就 没有 被 连 到 任何 带 点 的 顶点 上 。 然 后 M 重新 设置 下 划 线 ， 
使 得 ni 是 下 一 个 不 带 点 的 顶点 ，nz 是 第 一 个 带 点 的 顶点 ， 重 复 本 段 中 的 步 又 。 如 果 还 没 
有 多 余 的 不 带 点 的 项 点 ， 则 M 未 能 发 现任 何 新 的 顶点 可 以 加 点 ， 故 转 人 第 4 步 。 

对 于 第 4 步 ，M 扫描 顶点 序列 ， 检 查 是 否 都 已 被 加 点 。 如 果 是 ， 则 进入 接受 状态 ， 否 


则 进入 拒绝 状态 。 这 就 完成 了 图 灵机 M 的 描述 。 
练习 
3.1 此 练习 与 图 灵机 M 有 关 ， 例 3.4 给 出 了 它 的 描述 及 状态 图 。 在 下 列 每 个 输入 串 上 ， 给 出 M 所 
进入 的 格局 序列 : 
a. 0 Ab. 00 c. 000 d. 000000 
3.2 此 练习 与 图 灵机 M 有 关 ， 例 3.5 给 出 了 它 的 描述 及 状态 图 。 在 下 列 每 个 输入 串 上 ， 给 出 Mi 所 
进入 的 格局 序列 : 
âa. 11 WIRI &l# #1 d. 10 #11 
e. 10410 


^3.3 修改 定理 3.10 以 得 到 推论 3.12 的 证 明 ， 即 证 明 一 个 语言 是 可 判定 的 当 且 仅 当 有 非 确 定型 图 灵机 
判定 它 。( 可 以 假设 关于 树 的 下 列 定理 成 立 : 如 果 一 棵 树 中 的 每 个 结 点 只 有 有 限 多 个 子 结 点 ， 且 
此 树 的 每 一 个 分 支 只 有 有 限 多 个 结 点 ， 则 此 树 本 身 只 有 有 限 多 个 结 点 。) 
3.4 给 出 枚 举 器 的 一 个 形式 化 定义 。 可 将 其 看 作 一 种 双 带 图 灵机 ， 用 它 的 第 二 个 带子 作为 打印 机 。 包 
括 它 所 枚 举 的 语言 的 定义 。 
A3.5 检查 图 灵机 的 形式 化 定义 ， 回 答 下 列 问 题 并 解释 你 的 推理 : 
a 图 灵机 能 在 它 的 带子 上 写 下 空白 符 吗 ? 
b. 带子 字母 表 卫 和 输入 字母 表 卫 能 相同 吗 ? 
c. 图 灵机 的 读 写 头 能 在 连续 的 两 步 中 处 于 同一 个 位 置 吗 ? 
d. 图 灵机 能 只 包含 一 个 状态 吗 ? 
3.6 定理 3.13 证 明了 一 个 语言 是 图 灵 可 识别 的 当 且 仅 当 有 枚 举 器 枚 举 它 。 为 什么 不 能 用 下 列 更 简单 的 
算法 作为 充分 性 的 证 明 ? 像 以 前 一 样 ，s1 ,ss ,… 是 5* 中 的 所 有 串 。 
E= “ARMA, 
1. 对 于 i=1,2,3,-+, Be FAR, 
2. Æ s; 上 运行 M。 
3. 如 果 接 受 ， 则 打印 出 sio” 
3.7 下 面 描 述 的 不 是 一 个 合法 的 图 灵机 ， 解 释 为 什么 。 
Mya = “FEMA (p> 上， 其 中 p 为 变 元 xX1,，… ,xs 上 的 一 个 多 项 式 : 
1. 让 zi, +, se 取 所 有 可 能 的 整数 值 。 
2. 对 所 有 这 些 取 值 求 p 的 值 。 
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3. 只 要 某 个 取 值 使 得 p 为 0， 则 接受 ， 否则 拒绝 。” 


3.8 下 面 的 语言 都 是 字母 表 (0.1) 上 的 语言 ， 以 实现 层次 的 描述 给 出 判定 这 些 语 言 的 图 灵机 : 


问题 


“3.9 


AS AY 


3.18 


Aa. {w|w 包 含 相同 个 数 的 0 和 1}. 


b. (w| w 所 包含 的 0 的 个 数 是 1 的 个 数 的 两 倍 }。 
c. {w w 所 包含 的 0 的 个 数 不 是 1 的 个 数 的 两 倍 }。 


设 A 是 仅 含 一 个 串 * 的 语言 ， 其 中 : 

(0 如 果 火 星 上 没有 任何 生命 

> 【1 如 果 火 星 上 发 现 生命 
A 是 可 判定 的 吗 ? HHA? 在 本 题 中 ,假设 “火星 上 是 否 有 生命 ”这 一 问题 的 答案 只 有 “有 ” 
或 “没有 ”两 种 。 


REMA cl za 十 czz2 1! 十 … 十 cnz 十 cn+1 有 根 工 二 xo，cmax 是 ci 的 最 大 绝对 值 。 证 明 
Cmax 
a | EO 


证 明 : 不 能 在 带子 的 输入 区 域 写 的 单 带 图 灵机 只 能 识别 正则 语言 。 

证 明 每 一 个 无 穷 图 灵 可 识别 语言 都 有 一 个 无 穷 可 判定 子 集 。 

证 明 : 一 个 语言 是 可 判定 的 ， 当 且 仅 当 有 枚 举 器 以 标准 字符 串 顺 序 枚 举 这 个 语言 。 

设 图 灵 可 识别 语言 B={(CM),(M:》,…}》 由 图 灵机 的 描述 组 成 ， 证 明 存 在 一 个 以 图 灵机 作为 输 
和 人 字符 的 图 灵 可 识别 语言 C， 使 得 在 B 中 的 每 一 个 图 灵机 在 C 中 也 有 一 个 图 灵机 与 之 等 价 ， 反 
ZIV « 

证 明 图 灵 可 识别 语言 类 在 下 列 运算 下 封闭 : 


Aa. 并 b. 连接 c RES d. 交 e 同 态 
证 明 可 判定 语言 类 在 下 列 运算 下 封闭 : 
Aa. 并 b. 连接 c 星 号 d. 补 e. 交 


只 写 一 次 图 灵机 (write-once Turing machine) 是 一 个 单 带 图 灵机 ， 它 在 每 个 带子 方 格 上 最 多 只 
能 改变 其 内 容 一 次 (包括 带子 上 的 输入 区 )。 证 明 图 灵机 模型 的 这 个 变形 等 价 于 普通 的 图 灵机 模 
型 。( 提 示 : 首先 考虑 如 下 图 灵机 : 可 以 修改 带子 方 格 最 多 两 次 ， 使 用 多 个 带子 .) 
双 无 限 带 图 灵机 (Turing machine with doubly infinite tape) 与 普通 图 灵机 相似 ， 所 不 同 的 是 它 的 
带子 向 左 和 向 右 都 是 无 限 的 。 此 带子 在 开始 时 ， 除 了 包括 输入 区 域外 ， 其 他 都 填 以 空白 符 ， 计 
算 也 像 通常 一 样 定 义 ， 只 是 在 它 向 左 移动 时 不 会 遇 到 带子 的 端点 。 证 明 这 种 类 型 的 图 灵机 识别 
图 灵 可 识别 语言 类 。 
左 复位 图 灵机 (Turing machine with left reset) 和 普通 图 灵机 类 似 ， 只 是 它 的 转移 函数 具有 下 列 
形式 : 

QXT = QXTX iR;RESET)} 
如 果 6(q,a) 一 (7r,p,RESET)， 则 当 机 器 处 于 状态 g Higa 时 ,在 带子 上 写 下 6 并 进入 状态 r 后 ， 
读 写 头 就 跳 到 带子 的 左 端点 。 注 意 ， 这 样 的 机 器 没有 将 它 的 读 写 头 向 左 移动 一 个 符号 的 普通 能 
力 。 证 明 左 复位 图 灵机 识别 图 灵 可 识别 语言 类 。 
以 停留 代替 左 移 图 灵机 (Turing machine with stay put instead of left) 和 普通 图 灵机 类 似 ， 只 是 
它 的 转移 函数 具有 下 列 形式 : 

ô:QXT > QXTX {R,S} 

在 任何 时 候 ， 机 器 可 以 将 读 写 头 向 右 移 ， 或 让 其 停留 在 原 地 不 动 。 证 明 这 样 的 图 灵机 与 普通 图 
灵机 不 等 价 ， 这 样 的 图 灵机 识别 什么 语言 类 ? 
队列 自动 机 (queue automaton) 类 似 于 下 推 自动 机 ， 只 是 栈 换 成 了 队列 ， 队 列 是 只 能 从 左边 写 
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入 符号 从 右边 读 出 的 带子 ， 每 次 写 操作 GE) 往 队 列 的 左 端 增加 一 个 字符 ， 每 次 读 操作 G) 从 
队列 的 右 端 读 取 一 个 字符 并 随即 将 其 从 带子 上 删除 。 和 下 推 自 动机 一 样 ， 队 列 自 动机 的 输入 被 
放 在 一 条 单独 的 只 读 输入 带 上 ， 且 读 写 头 只 能 在 输入 带 上 从 左 向 右 移动 ， 输 入 带 在 输入 字符 串 
后 跟 一 空白 字符 以 标识 输入 的 结束 位 置 。 队 列 自动 机 在 对 输入 进行 操作 的 过 程 中 ， 只 要 进入 一 
个 接受 状态 ， 机 器 就 接受 。 证 明 一 个 语言 能 被 一 个 确定 型 队列 自动 机 识别 当 且 仅 当 该 语言 是 图 
灵 可 识别 的 。 

3.22 it k PDA 表示 有 上 个 栈 的 下 推 自动 机 。 因 此 ，0-PDA 就 是 一 个 NFA，1-PDA 就 是 通常 的 PDA, 
已 经 知道 1-PDA 比 0-PDA 更 强 (识别 更 大 的 语言 类 )，。 
a. 证 明 2-PDA 比 1-PDA 更 强 。 
b. 证 明 3-PDA 不 比 2-PDA 更 强 。 
(提示 : 用 两 个 栈 来 模拟 一 个 图 灵机 带 。) 


习题 选 解 
3.1 b.g,00, Lg,0, U xg; Us Ug xL q; UxUs» Lg,xLl, U xg, Us LESLI as 
3.2 ag ll, xq}l, xlg, Us xl U dice ° 
3.3 证 明 推 论 的 两 个 方向 。 首 先 ， 如 果 语 言 工 是 可 判定 的 ， 则 它 能 被 一 个 确定 型 图 灵机 判定 ， 而 确定 
型 图 灵机 自然 是 一 个 非 确定 型 图 灵机 。 其 次 ， 如 果 语 言 工 能 被 一 个 非 确定 型 图 灵机 N 所 判定 ， 那 
么 按 如 下 步骤 修改 定理 3. 10 的 证 明 中 给 出 的 确定 型 图 灵机 D., HPR 4 移 到 步骤 5。 增 加 新 的 步 
又 4: 如 果 N 的 所 有 非 确定 性 的 分 支 都 被 拒绝 ， 则 拒绝 。 
现在 讨论 新 的 图 灵机 DEL 的 判定 器 。 如 果 NN 接受 它 的 输入 ，D 也 最 终 会 找到 一 个 接受 分 支 并 
接受 。 如 果 N 拒绝 它 的 输入 ， 则 它 的 所 有 分 支 将 因 其 为 判定 器 而 停止 并 拒绝 。 因 此 ， 每 个 分 支 有 
有 限 个 结 点 ， 每 个 结 点 代表 N 的 一 步 计 算 。 所 以 根据 前 面 练习 给 出 的 关于 树 的 描述 可 知 ，N 在 一 
个 输入 上 的 完整 计算 树 是 有 限 的 。 从 而 ， 当 这 棵 树 遍 历 完 后 D 将 停止 并 拒绝 。 
a. 是 。 带 子 字 母 表 本 包括 UU， 图 灵机 能 在 带子 上 写 下 厂 中 的 任何 字符 。 
b. FE. SAFE U, (RBA U。 因 此 它们 不 能 相等 。 
. 是 。 知 图 灵机 试图 从 带子 的 左 端点 向 左 移动 读 写 头 ， 则 读 写 头 保持 原来 位 置 不 变 。 
. 不 是 。 任 何 图 灵机 必须 包括 两 个 可 区 分 的 状态 accept All quss， 因 此 ， 一 个 图 灵机 至 少 包括 两 个 
3.8 a “FRA w: 
1. 扫描 带子 并 对 第 一 个 未 标记 的 0 进行 标记 。 如 果 没 有 发 现 未 被 标记 的 0， 则 转 到 第 4 步 ， 否 
则 ， 读 写 头 返回 至 带子 的 左 端点 。 
2. 扫描 带子 并 对 第 一 个 未 标记 的 1 进行 标记 。 如 果 没 有 发 现 未 被 标记 的 1， 则 拒绝 。 
3. 读 写 头 返回 至 带子 左 端点 ， 并 转 到 第 1 步 继续 执行 。 
4. 读 写 头 返 回 至 带子 左 端点 ， 扫 描 带 子 以 发 现 是 否 存 在 未 被 标记 的 1。 如 果 没 有 则 接受 ， 否 则 
3.9 语言 A 是 语言 (0) 或 语言 (1) 之 一 ， 这 两 个 语言 都 是 有 穷 的 ， 因 此 是 可 判定 的 。 如 果 不 能 判定 
上 述 两 个 语言 哪 一 个 是 A， 也 就 不 能 描述 出 A 的 判定 器 。 但 是 ， 可 以 给 出 两 个 图 灵机 ， 其 中 必 有 
一 个 是 A 的 判定 器 。 
3.15 a 对 任意 两 个 图 灵 可 识别 语言 Li. Le 及 其 对 应 的 图 灵 识 别 机 Mi. M, WA RIL MRS Ly 
5 L: 的 并 集 。 
“对 于 输入 w: 
1. 逐步 地 在 w 上 交替 地 运行 Mi 和 M2。 任何 一 个 接受 ， 则 M 接受 。 如 果 两 个 机 器 都 停机 
并 拒绝 ， 则 M 拒绝 。” 


3.5 


a O 
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WR Mi R M: 接受 w， 则 因为 接受 图 灵机 在 有 限 步 达到 接受 状态 ， 从 而 M 也 接受 w。 注 意 : 
WR M, M 都 拒绝 或 者 任何 一 个 处 于 循环 状态 ， 则 M 将 一 直 循 环 下 去 。 
3.16 a 对 于 任意 两 个 可 判定 语言 LE 和 Lz ， 设 图 灵机 Mi AM, 分 别 判定 它们 。 构 造 图 灵机 M 来 判定 
ia Li ML: 的 并 集 : 
“对 于 输入 w: 
1. 在 w 上 运行 M1。 如 果 它 接受 ， 则 接受 。 
2. 在 ww 上 运行 M;。 如 果 它 接受 ， 则 接受 ， 否 则 拒绝 。” 
如 果 Mi 或 Ms 接受 w， 则 M 接受 凤 。 如 果 二 者 都 拒绝 ， 则 M 拒绝 。 
3.17 首先 用 一 个 两 次 写 图 灵机 模拟 一 个 普通 图 灵机 。 两 次 写 图 灵机 将 整个 带子 的 字符 串 内 容 拷贝 到 和 带 
子 右边 的 空白 部 分 〈 也 即 在 带子 上 第 一 个 空白 字符 处 开始 对 带子 上 的 字符 串 进行 拷贝 )， 来 模拟 原 
来 机 器 的 一 步 操 作 。 机 器 逐 字 符 拷 贝 并 对 其 进行 标记 ， 这 个 过 程 会 对 每 个 带子 方 格 进行 两 次 操作 。 
第 一 次 写字 符 ， 第 二 次 紧 接 着 对 这 个 字符 进行 标记 ， 以 标识 其 已 经 被 拷贝 。 原 来 图 灵机 的 读 写 头 
位 置 在 带子 上 进行 标记 ， 当 把 方 格 中 的 内 容 拷贝 到 这 个 位 置 或 者 其 旁边 时 ， 带 子 的 内 容 根 据 原 来 
图 灵机 的 规则 进行 更 新 。 
用 一 次 写 图 灵机 进行 模拟 时 ， 其 操作 同 两 次 写 图 灵机 ， 只 是 原来 带子 上 的 每 个 方 格 现在 用 两 
个 方 格 表示 ， 第 一 个 存储 原来 带子 上 的 符号 ， 第 二 个 存储 在 拷贝 过 程 中 做 上 标记 的 字符 。 输 入 不 
能 用 两 个 格子 代表 一 个 字符 ， 因 此 ， 在 第 一 次 带子 被 拷贝 时 ， 就 直接 在 输入 字符 上 进行 标记 。 


第 4 章 | 


Introduction to the Theory of Computation, 3e 


可 判定 性 





第 3 章 引 入 了 图 灵机 作为 通用 计算 机 模型 ， 并 根据 丘 奇 - 图 灵 论 题 ， 用 图 灵机 定义 了 

本 章 开 始 研 究 算法 求解 问题 的 能 力 。 我 们 将 证 明 ， 有 些 问 题 算 法 上 能 够 求解 ， 但 另 一 
些 则 不 能 。 本 章 则 在 人 研究 算法 可 解 性 的 局 限 。 也 许 不 少 人 对 算法 可 解 性 已 知之 其 多 ， 因 为 
计算 机 科学 的 绝 大 部 分 是 研究 可 求解 问题 的 。 但 这 一 章 里 断言 有 些 问题 是 不 可 解 的 ， 这 可 
能 会 让 人 感到 意外 。 

通常 ， 人 们 追求 问题 的 答案， 而 在 此 时 试图 证 明 该 问题 的 不 可 解 性 似乎 没有 什么 用 
处 。 但 是 研究 不 可 解 性 的 理由 有 二 : 第 一 ， 知 道 问 题 在 算法 上 是 不 可 解 的 ， 就 不 必 浪 费力 
量 去 寻找 不 存在 的 解法 ， 进 而 可 以 把 精力 花 在 改变 或 简化 问题 ， 以 便 找到 简化 问题 的 算法 
解 上 。 像 任何 工具 一 样 ， 计 算 机 也 有 能 力 上 的 局 限 。 要 想 很 好 地 使 用 计算 机 ， 必 须 正 确 地 
认识 它 的 能 力 和 局 限 。 第 二 ， 能 锻炼 人 的 能 力 ， 即 使 你 处 理 的 问题 都 是 可 解 的 ， 了 解 不 可 
解 性 也 能 激发 你 的 想象 ， 并 帮助 你 全 面 而 透彻 地 理解 什么 是 计算 。 


41 可 判定 语言 

本 节 将 给 出 一 些 算法 上 可 判定 的 语言 的 例子 。 我 们 将 关注 涉及 自动 机 和 文法 的 语言 。 
例如 ， 提 出 一 个 算法 来 检测 一 个 串 是 否 是 一 个 上 下 文 无 关 语 言 (context-free language, 
CFL) 中 的 元 素 。 关 注 这 些 语言 是 有 趣 的 ， 因 为 : 首先 ， 某 些 问 题 是 和 应 用 相关 的 。 例 如 
测试 一 个 上 下 文 无 关 文 法 是 否 可 生成 某 一 个 串 ， 这 一 问题 就 和 程序 设计 语言 中 的 程序 识别 
及 编译 有 关 。 此 外 ， 某 些 涉 及 上 自动 机 和 文法 的 问题 在 算法 上 却 是 不 可 判定 的 。 开 始 举 的 例 
子 很 可 能 是 可 判定 的 ， 而 这 或 许 有 助 于 你 领会 一 些 不 可 判定 的 例子 。 


4.1.1 与 正则 语言 相关 的 可 判定 性 问题 


首先 介绍 与 有 穷 自动 机 有 关 的 计算 问题 。 我 们 将 给 出 算法 来 检测 一 个 有 穷 自动 机 是 否 
接受 一 个 串 、 一 个 有 穷 自动 机 的 语言 是 否 为 空 以 及 两 个 有 穷 自动 机 是 否 等 价 等 问题 。 

因为 已 经 建立 了 处 理 语言 的 术语 ， 故 为 方便 起 见 ， 就 用 语言 来 表示 各 种 计算 问题 。 例 
如 DFA 接受 问题 (acceptance problem)， 检 测 一 个 特定 的 确定 型 有 穷 自 动机 是 否 接 受 一 个 
事先 给 定 的 串 ， 此 问题 可 表示 为 语言 Aora, CAA TMA DFA 的 编码 以 及 DFA 接受 的 
串 的 编码 。 令 

ApFA 一 41《4B,w)|B 是 DFA 并 且 接 受 输 入 串 w) 

问题 “DFA B 是 否 接 受 输入 w” 与 问题 “(B,w〉 是 否 是 Aora 的 元 素 ” 是 相同 的 。 类 
似 地 ， 其 他 一 些 计 算 问 题 也 可 表示 成 检查 语言 的 成 员 隶 属 关 系 ， 证 明 这 个 语言 是 可 判定 的 
与 证 明 这 个 计算 问题 是 可 判定 的 是 同一 回 事 。 

下 面 的 定理 将 证 明 AprfA 是 可 判定 的 ， 因 而 也 就 证 明了 问题 “一 个 给 定 的 有 穷 自 动机 
是 否 接受 一 个 给 定 的 串 ” 是 可 判定 的 。 
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Arma %— 4 FI) £18 = 

证 明 思 路 证 明 思 路 非常 简单 。 只 要 设计 一 个 判定 Apra 的 图 灵机 M 即 可 。 

M= “IIFA (Bw), HP BEDFA, whe: 

1. 在 输入 w 上 模拟 B。 
2. 如 果 模 拟 以 接受 状态 结束 ， 则 接受 ; 如 果 以 非 接受 状态 结束 ， 则 拒绝 。” 

证 明 我 们 仅 提 及 证 明 中 的 某 些 实现 细节 。 如 果 你 对 某 个 标准 程序 设计 语言 很 熟悉 ， 
那 就 想 一 想 ， 怎 样 写 一 个 程序 来 执行 这 个 模拟 。 

首先 检查 输入 (Bow), ERRAR w A DFA B。B 的 一 个 合理 的 表示 方法 是 简单 
地 列 出 它 的 五 个 元 素 Q、 .Sa 及 下。 当 M 收 到 输入 时 ， 首 先 检查 它 是 否 正确 地 表示 了 
DFA BAH w。 如 果 不 是 ， 则 拒绝 。 

然后 M 直接 执行 模拟 。 用 在 带子 上 写 下 信息 的 方法 ， 它 可 以 记录 B 在 输入 w 上 运行 
时 的 当前 状态 和 当前 位 置 。 运 行 开 始 时 ，B 的 当前 状态 是 gq,。， 读 写 头 的 当前 位 置 是 ww 的 
最 左 端 符号。 状态 和 位 置 的 更 新 是 由 转移 也 数 6 决定 的 。 当 M 处 理 完 w 的 最 后 一 个 符号 
时 ， 如 果 B 处 于 接受 状态 ， 则 M 接受 这 个 输入 ; 如果 不 是 ， 则 M 拒绝 。 s 

对 非 确 定型 有 穷 自动 机 ， 可 以 证 明 类 似 的 定理 。 设 

AnFA 二 {4B,w)|B 是 NFA 并 且 接 受 输入 上 串 w) 

ANFA 是 一 个 可 判定 语言 。 

证 明 构造 一 个 判定 Arra 的 图 灵机 N。 可 以 将 六 设计 成 与 M 一 样 ， 只 是 将 模拟 
DFA 改 为 模拟 NFA., 但 我 们 不 这 样 做 。 下 面 说 明 一 个 新 想法 : 用 M 作为 N 的 子 程序 。 
因为 M 被 设计 成 只 接收 DFA 作为 输入 ， 故 NN 先 将 作为 输入 所 收 到 的 NFA 转换 成 DFA, 
然后 再 将 它 传 给 M。 

N= “HFAA (B w), H} B Æ NFA, we: 

1. 用 定理 1.19 所 给 的 转换 过 程 将 NFA B 转换 成 一 个 等 价 的 DFA C. 
2. FEMA (C, w) 上 像 定 理 4. 1 那样 运行 图 灵机 M., 
3. WR M 接受 ， 则 接受 ， 否 则 拒绝 。” 
第 2 步 中 ,“ 运 行 图 灵机 M” 的 含义 是 : 将 M 作为 一 个 子 程 序 加 进入 的 设计 中 。 m 
可 以 类 似 地 测定 一 个 正则 表达 式 是 否 派 生 一 个 给 定 的 串 。 设 
AREX 二 {《R,w)|R 是 正则 表达 式 ,w 是 串 ,R 派生 www) 

AREx 是 一 个 可 判定 语言 。 

证 明 下 面 的 图 灵机 P 判定 Arex. 

P= 二 “在 输入 〈R,w〉 上 ， 其 中 R 是 正则 表达 式 ，w 是 串 : 

1. 用 定理 1. 28 所 给 的 转换 过 程 将 正则 表达 式 R 转换 成 一 个 与 之 等 价 的 NFA A, 
2. 在 输入 《A,w〉 上 运行 图 灵机 N. 
3. WR NN 接受 ， 则 接受 ; WRN 拒绝 ， 则 拒绝 。” = 

E 4.1, 4.2 和 4. 3 说 明 ， 对 于 可 判定 性 , H DFA, NFA 或 正则 表达 式 表达 图 灵机 
都 是 等 价 的 ， 因 为 图 灵机 能 将 它们 的 编码 进行 互相 转换 。 

现在 转向 与 有 穷 自动 机 有 关 的 男 一 种 问题 ， 有 穷 自 动机 语言 的 空 性 质 测试 。 在 以 前 的 
定理 中 ， 常 常 必须 检查 一 个 有 穷 自动 机 是 否 接受 一 个 特定 的 串 。 在 下 面 的 证 明 中 ， 要 检查 
一 个 有 穷 自 动机 是 否 根 本 不 接受 任何 串 。 令 
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Epa = {(A)|A #—* DFA, E L(A) =} 

EpFA 是 一 个 可 判定 语言 。 

证 明 DFA 接受 一 个 串 当 且 仅 当 : 从 起 始 状态 出 发 ， 沿 着 此 DFA 的 箭头 方向 ， 能 够 
到 达 一 个 接受 状态 。 为 检查 这 个 条 件 ， 设 计 一 个 使 用 标记 算法 的 图 灵机 工 ， 此 算法 已 在 例 ， 
3. 14 中 使 用 过 。 

T 一 “对 于 输入 (A), HHA 是 一 个 DFA: 

1. 标记 A 的 起 始 状 态 。 

2. 重复 下 列 步骤 ， 直 到 所 有 状态 都 被 标记 。 

3. 对 于 一 个 状态 ， 如 果 有 一 个 到 达 它 的 转移 是 从 某 个 已 经 标记 过 的 状态 出 发 的 ， 
则 将 其 标记 。 

4. 如 果 没 有 接受 状态 被 标记 ， 则 接受 ， 否 则 拒绝 。” # 

下 一 个 定理 证 明 :检查 两 个 DFA 是 否 识 别 同一 个 语言 是 可 判定 的 。 设 

EQpra = ({(A,B)|A #1 B 4 % DFA, H L(A) =L(B)} 

EQbpFA 是 一 个 可 判定 语言 。 

WEAR 用 定理 4.4 来 证 明 本 定理 。 下 面 由 A 和 B 来 构造 一 个 新 的 DFA C， 使 得 C 只 
接受 这 样 的 串 : A 或 B 接受 但 不 是 都 接受 。 这 样 如 果 A 和 B 识别 相同 的 语言 ， 则 C 不 接 
受 任何 串 。C 的 语言 

LOC} = CAYOBI UTAA LL BY 

此 处 L(A) 是 L(A) 的 补 集 ， 这 个 表达 式 称 为 L(A) 和 工 (B) 的 对 称 差 (symmetric 
difference), W K 4-1。 这 里 ， 对 称 差 是 有 用 的 ， 因 为 
L(O=S 4AM L(A)=L(B). 已 经 证 明正 则 语言 
在 补 、 并 和 交 下 是 封闭 的 。 这 些 证明 所 使 用 的 构造 可 以 用 
来 构造 C。 这 些 构造 都 是 算法 ， 可 以 由 图 灵机 来 执行 。 一 
旦 完成 了 C 的 构造 ， 就 可 用 定理 4.4 来 检查 L(C) 是 否 为 
=, 。 如 果 它 是 空 的 ，L(A) 与 L(B) 必定 相等 。 

F=“ FA (A,B), 其 中 A 和 B AE DFA, 

1. 如 上 描述 的 那样 构造 DFA C。 
2. 在 输入 〈C〉 上 运行 定理 4.4 中 的 图 灵机 工 。 
3. WR TRS, MHS; MRT BA, Mee.” a 


4.1.2 与 上 下 文 无 关 语 言 相关 的 可 判定 性 问题 


下 面 摘 述 两 个 算法 ， 一 个 检查 某 个 CFG 是 否 派 生 一 个 特定 的 串 ， 另 一 个 检查 某 一 

CFG 的 语言 是 否 为 空 。 设 
Acre = ((G,w) |G 是 CFG,w £#,G Rw} 

Aoc -ATIRE = 

证 朋 思 路 对 于 CFGGAHw, HRA G 是 否 产 生 w。 一 个 思路 是 : 让 G 遍历 所 有 
派生 ， 以 确定 哪 一 个 是 w 的 派生 。 但 这 个 思路 行 不 通 ， 因 为 这 样 可 能 要 检查 无 限 多 个 派 
生 。 如 果 G 不 产生 www， 这 个 算法 将 不 终止 。 这 个 思路 给 出 的 图 灵机 只 是 Acre 的 一 个 识别 
Aro MIEXI EZE. 





图 4-1 L(A) 5 LOB) 的 对 称 差 
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为 将 这 个 图 灵机 变 成 一 个 判定 器 ， 需 要 保证 算法 只 检查 有 限 多 个 派生 。 问 题 2. 38 证 
明了 如 果 G 是 一 个 乔 姆 斯 基 范 式 ， 则 w 的 任意 派生 都 是 2n 一 1 步 ， 其 中 是 w 的 长 度 。 
此 时 ， 为 确定 G 是 否 产 生 w， 只 需 检查 步 长 在 2n 一 1 内 的 派生 即 可 ， 这 样 的 派生 只 有 有 限 
多 个 。 而 用 在 2. 1 节 给 出 的 过 程 ， 就 可 将 G 转换 成 乔 姆 斯 基 范 式 。 

WEAR 识别 Acrc 的 图 灵机 S 如 下 : 

S 二 “对 于 输入 〈G,w)， 其 中 ，G 是 一 个 CFG, w 是 一 个 串 : 

1. 将 G 转换 成 一 个 与 之 等 价 的 乔 姆 斯 基文 法 。 

2. 列 出 所 有 2n 一 1 HRE, EP nEw 的 长 度 ， 除 非 n= 二 0， 此 时 列 出 一 步 以 内 
的 派生 。 

3. 如 果 这 些 派生 中 有 一 个 产生 w， 则 接受 ; 如 果 没 有 ， 则 拒绝 。” a 

检查 一 个 CFG 是 否 产生 一 个 特定 串 和 程序 设计 语言 的 编译 密切 相关 。 图 灵机 S 中 的 算 
法 效率 非常 低 ， 并 且 永 远 不 会 在 实际 中 使 用 ， 但 它 很 容易 描述 ， 且 这 里 并 不 关心 效率 。 在 本 
书 的 第 3 部 分 将 强调 算法 的 运行 时 间 和 存储 使 用 。 定 理 7. 14 的 证 明 将 描述 一 个 更 有 效 的 算 
法 来 识别 一 般 的 上 下 文 无 关 语 言 。 对 识别 确定 型 上 下 文 无 关 语 言 还 可 望 获得 更 高 的 效率 。 

在 定理 2. 12 中 已 经 给 出 了 CFG 和 PDA 之 间 的 相互 转换 过 程 。 因 此 ， 此 处 关于 CFG 
问题 的 可 判定 性 讨论 完全 适用 于 PDA. 

现在 讨论 CFG 语言 的 空 性 质 测 试问 题 。 如 对 待 DFA 那样 ， 可 以 证 明 : 检查 一 个 CFG 
是 否 不 派生 任何 串 是 可 判定 的 。 设 

Ecrg ={ (G) |G 是 一 个 CFG, H L(G) =Ø} 

Ecc- ATIRE E., 

证 明 思 路 ” 先 给 出 一 个 容易 想到 但 行 不 通 的 想法 : 试用 定理 4.6 中 的 图 灵机 S。 此 定 
理 告诉 我 们 ， 能 够 检查 一 个 CFG 是 否 产生 某 个 特定 串 。 为 确定 工 (GC) 三 包 是 否 成 立 ， 似 乎 
可 以 让 图 灵机 S 一 个 一 个 地 检查 所 有 可 能 的 w。 但 w 有 无 限 多 ， 故 这 个 算法 将 永远 检查 
下 去 ， 永 不 停止 。 我 们 需要 另 想 办 法 。 

为 检查 一 个 文法 的 语言 是 否 为 空 ， 需 要 检查 起 始 变 元 能 否 产 生 一 个 终结 符 串 。 算 法 解 
决 的 是 一 个 更 一 般 的 问题 ， 它 不 仅 检查 起 始 变 元 ， 而 且 检 查 每 一 个 变 元 ， 以 确定 这 个 变 元 
能 否 产 生 一 个 终结 符 串 。 在 确定 某 个 变 元 能 够 产生 一 个 终结 符 串 后 ， 算 法 就 将 这 个 变 元 作 
上 标记 ， 以 记录 这 个 信息 。 

算法 先 在 文法 中 的 所 有 终结 符 上 作 标 记 ， 然 后 扫描 所 有 的 文法 规则 。 如 果 发 现 某 个 规 
则 允许 用 符号 串 来 取代 一 个 变 元 ， 且 符号 串 中 的 所 有 符号 都 已 被 作 过 标记 ， 则 算法 知道 ， 
这 个 变 元 也 能 被 作 上 标记 。 这 样 继续 下 去 ， 直 到 找 不 到 可 以 作 标 记 的 变 元 为 止 。 下 面 的 图 
灵机 R 实现 这 个 算法 。 

WE PH 

R=“ FAA (G), H G 是 一 个 CFG: 

1. 将 G 中 所 有 的 终结 符 全 都 作 上 标记 。 

2. 重复 下 列 步 骤 ， 直 到 找 不 到 可 以 作 标 记 的 变 元 。 

3. 如 果 G 有 规则 A 一 UIUz…UKk， 且 U1,U2,° Uk 中 的 每 个 符号 都 已 被 作 过 标 
记 ， 则 将 变 元 A 作 标 记 。 

4. 如 果 起 始 变 元 没有 被 标记 ， 则 接受 ; 否则 拒绝 。” a 
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下 面 讨论 检查 两 个 上 下 文 无 关 文 法 是 否 派 生 同 一 个 语言 的 问题 。 设 
EQcrg ={(G,H)|G #1 H 4% CFG, H L(G)=L(H)} 
对 有 穷 自 动机 ， 定 理 4.5 给 出 了 判定 语言 EQpra 的 算法 。 在 证 明 EQpra 是 可 判定 时 ， 使 用 
了 EprA 的 判定 过 程 。 对 于 上 下 文 无 关 语 言 ， 可 能 有 人 认为 ， 因 为 下 crc 也 是 可 判定 的 ， 似 
乎 可 以 用 类 似 方法 来 证 明 EQcrcG 是 可 判定 的 。 但 这 个 思路 有 问题 。 练 习 2.2 已 经 证 明 ， 上 
下 文 无 关 语 言 类 在 补 和 交 运 算 下 不 封闭 。 事 实 上 ，EQcrc 不 是 可 判定 的 ， 这 可 用 将 在 第 5 
章 中 介绍 的 一 种 技术 来 证 明 。 
现在 来 证 明 上 下 文 无 关 语言 都 可 以 用 图 灵机 来 判定 。 
每 个 上 下 文 无 关 语言 都 是 可 判定 的 。 
证 明 思 路 设 A 是 一 个 CFL。 目标 是 证 明 A 是 可 判定 的 。 一 个 ( 行 不 通 的 ) BRE: 
将 A 的 一 个 PDA 直接 转换 成 图 灵机 ， 这 并 不 难 做 到 ， 因 为 图 灵机 的 珊 子 的 功能 更 蝇 ， 用 
来 模拟 栈 是 容易 的 。A 的 这 个 PDA 可 能 是 非 确 定型 的 ， 这 看 上 去 也 不 会 有 问题 ， 因 为 可 
将 其 转换 为 非 确定 型 图 灵机 ， 而 任何 非 确 定型 图 灵机 都 可 转化 为 与 之 等 价 的 确定 型 图 灵 
机 。 然 而 还 是 有 困难 ，PDA 计算 的 某 些 分 支 可 能 会 永远 进行 ， 即 不 停 地 在 栈 上 读 和 写 而 
不 能 停机 。 这 样 一 来 ， 模 拟 它 的 图 灵机 也 就 有 不 停机 的 计算 分 文 ， 因 而 这 个 图 灵机 就 不 是 
一 个 判定 器 。 故 必须 有 不 同 的 思路 。 本 和 定理 的 证 明 使 用 了 判定 Acrfc 的 图 灵机 S， 这 个 图 灵 
机 是 在 定理 4.6 中 设计 的 。 
证 明 设 G 是 A 的 一 个 CFG。 下 面 设计 一 个 判定 A 的 图 灵机 Mc， 它 在 自己 内 部 建 
立 契 的 一 个 备份 。 其 工作 方式 如 下 : 
Mc 二 “对 于 输入 w: 
1. ÆA (G, w) 上 运行 图 灵机 S. 
2. 如 果 该 机 器 接受 ， 则 接受 ; AB 下 下 文 无 关 的 
绝 ， 则 拒绝 。” = 
至 此 ， 本 课程 描述 了 四 个 主要 语言 类 : IE 
则 的 、 上 下 文 无 关 的 、 可 判定 的 和 图 灵 可 识别 


NH, CH 4.8 在 它们 之 间 的 关系 图 中 画 出 了 最 


后 一 条 连 线 。 图 4- 2 描述 了 这 个 关系 。 图 4-2 语言 类 间 的 关系 


4.2 不 可 判定 性 


本 节 将 证 明 算 法 不 可 解 的 问题 是 存在 的 ， 这 是 计算 理论 中 最 具 哲 学 意义 的 定理 之 一 。 
计算 机 看 上 去 是 如 此 强大 ， 使 得 人 们 相信 所 有 问题 最 终 都 能 被 其 解决 。 可 是 上 述 定 理 说 
明 ， 本 质 上 计算 机 的 能 力 是 有 局 限 的 。 

什么 样 的 问题 是 计算 机 不 能 解 的 呢 ? 不可解 问 题 是 否 深奥 得 仅 藏 于 理论 科学 家 的 心中 
ME? 不 ! 现在 已 经 证 明 ， 其 至 一 些 人 们 非常 希望 解决 的 普通 问题 都 是 计算 上 不 可 解 的 。 

不 可 解 问题 之 一 是 : 假设 你 有 一 个 计算 机 程序 ， 还 有 一 个 说 明 书 ， 精 确 地 说 明了 此 程 
序 将 做 什么 〈 例 如 ， 说 明 此 程序 将 把 一 串 数列 进行 排序 )。 你 要 做 的 是 : 验证 该 程序 正 像 
说 明 书 所 说 的 那样 运行 〈 即 它 是 正确 的 ) 。 因 为 程序 和 说 明 书 都 是 像 数 学 一 样 的 精确 对 象 ， 
你 希望 将 验证 过 程 自动 化 ， 即 将 这 些 对 象 提 供给 一 个 适当 设计 的 计算 机 来 验证 。 但 你 将 会 
失望 ， 因 为 一 般 的 软件 验证 问题 用 计算 机 是 不 能 解决 的 。 

本 节 和 第 5 章 都 将 介绍 一 些 不 可 解 问题 ， 目 的 是 帮助 你 了 解 这 类 不 可 解 问 题 并 学 习 证 







图 灵 可 识别 的 
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明 不 可 解 性 的 技巧 。 

现在 介绍 第 一 个 不 可 解 性 定理 。 下 面 的 语言 是 不 可 判定 的 : 检查 一 个 图 灵机 是 否 接受 
一 个 给 定 的 串 问题 。 类 似 于 Anra 和 Acrc， 记 之 为 Arm。 但 Avra 和 Acrc 是 可 判定 的 ， 
ATM 却 不 是 。 


令 


Arm ={(M,w)|Mz—-4A RAL, HER w) 
ATM 是 不 可 判定 的 。 
先 证 明 Arw 是 图 灵 可 识别 的 。 这 样 ， 本 和 定理 表明 识别 器 确实 比 判 定 器 更 强大 。 要 求 图 灵 
机 (TM) 在 所 有 输入 上 都 停机 限制 了 它 能 够 识别 的 语言 种 类 。 下 面 的 图 灵机 U 识别 Am. 
U 二 “对 于 输入 《M,w)， 其 中 M 是 一 个 图 灵机 ，z 是 一 个 串 : 
1. 在 输入 w 上 模拟 M ; 
2. WR M 进入 接受 状态 ， 则 接受 ; WR M 进入 拒绝 状态 ， 则 拒绝 。” 
注意 ， 如 果 M Ew LA, MELU EWA (Mw) 上 循环 ， 这 就 是 U AF AM 
的 原因 。 假 如 M 知道 自己 在 w 上 不 停机 ， 这 种 情况 下 它 会 拒绝 。 然 而 ， 算 法 本 身 无 法 做 
这 样 的 决定 。 待 会 儿 我 们 会 看 到 这 种 情况 。 
图 灵机 UU 自 吴 也 很 和 意思 ， 它 是 所 谓 通 用 图 灵机 的 一 个 例子 。 通 用 图 灵机 是 图 灵 于 
1936 年 首次 提出 的 ， 之 所 以 称 之 为 “通用 ”， 是 因为 它 能 够 模拟 任何 其 他 图 灵机 ， 只 要 知 
道 其 描述 即 可 。 通 用 图 灵机 在 开发 早期 的 程序 存储 式 计算 机 过 程 中 曾 起 过 重要 作用 。 


4.2.1 对 角 化 方法 


ATM 不 可 判定 性 的 证 明 使 用 了 所 谓 的 对 角 化 技术 ， 此 方法 由 数学 家 康 托 (Georg 
Cantor) 在 1873 年 提出 。 康 托 那 时 关心 的 是 测量 无 限 集合 的 规模 问题 。 假 如 有 两 个 无 限 
集合 ， 怎 么 才能 说 其 中 一 个 比 另 一 个 大 ， 或 者 说 有 相同 的 规模 呢 ? 当然 ， 对 于 有 限 集合 ， 
回答 这 样 的 问题 很 简单 。 只 要 数 一 数 某 个 有 限 集 合 中 元 素 的 个 数 ， 所 得 的 数 就 是 它 的 规 
模 。 但 是 ， 如 果 试 图 去 数 一 个 无 限 集合 中 的 元 素 个 数 ， 将 永远 也 数 不 完 。 所 以 不 能 用 计数 
的 方法 来 确定 无 限 集合 的 相对 规模 。 

例如 ， 对 所 有 偶数 的 集合 和 {0,1} 上 所 有 串 的 集合 ， 这 两 个 集合 都 是 无 限 的 ， 因 而 比 
任何 有 限 集 合 都 大 。 但 它们 中 是 否 有 一 个 比 另 一 个 更 大 呢 ? 怎么 比较 它们 的 相对 规模 呢 ? 

康 托 对 此 提出 了 一 个 非常 好 的 解决 办 法 。 他 注意 到 : 对 于 两 个 有 限 集合 ， 如 果 其 中 一 
个 集合 的 元 素 能 与 另 一 集合 的 元 素 配 对 ， 则 它们 有 相同 的 规模 。 这 个 方法 没有 凭借 计数 就 
比较 了 规模 ， 因 而 可 以 将 此 思想 推广 到 无 限 集合 上 。 这 是 它 更 准确 的 含义 。 

设 A 和 B 是 两 个 集合 ，f 是 从 A 到 B 的 函数 。 如 果 f 从 不 将 两 个 不 同 
元 素 映 射 到 同一 个 对 象 ， 即 只 要 天 8 就 有 flaASflb), Me f 是 一 对 一 映射 (one-to- 
one) 的 。 如 果 了 能 击 中 吾 的 每 个 元 素 ， 即 : 对 B 的 每 个 元 素 5， 都 存在 aE A， 使 得 
f(a)=b, WA f AMRI Conto, surjective), wR A Æ BA f:A 一 B，f 是 一 对 一 映射 
又 是 满 映射 ， 则 称 集合 A 和 B 有 相同 规模 。 而 既是 一 对 一 映射 又 是 满 映射 的 函数 称 为 对 
应 (correspondence)。 在 对 应 中 ，A 的 每 个 元 素 映 射 到 B 的 唯一 一 个 元 素 ， 且 B 的 每 个 
元 素 都 有 A 的 唯一 一 个 元 素 映 射 到 它 。 对 应 就 是 将 A 的 元 素 与 B 的 元 素 进行 配对 的 方法 。 

一 对 一 映射 又 称 为 单 射 (injective) ， 对 应 又 称 为 双 射 (bijective) 。 
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UREI 设 NN 是 自然 数 集合 {1,2,3,…},，E 是 侦 自 然 数 的 集合 {2,4,6,7}. FARE 
的 关于 集合 规模 的 定义 可 以 看 到 : NA E 有 相同 的 规模 。 从 N 
映射 到 E 的 对 应 是 f(n) 二 2n。 借 助 于 表 4- 1 能 更 容易 地 看 清 f. oe) NENEI 

这 个 例子 似乎 令 人 意外 。 直 观 上 , E 似乎 比 N 小 ， 因 为 
E 是 N 的 一 个 真子 集 。 但 由 于 能 够 将 N 的 元 素 与 € 的 元 素 
进行 配对 。 故 可 以 下 结论 说 这 两 个 集合 有 相同 的 规模 。 时 

如 果 一 个 集合 A 是 有 限 的 或 者 与 N 有 相同 的 规模 ， 则 称 A 是 可 数 的 


(countable) 。 
CED LENA AES ARIAT. 2 Q= |Tim nEN EEA BREA, 


Q 看 上 去 似乎 比 N 大 得 多 ， 然 而 按照 定义 ， 这 两 个 集合 的 规模 相同 。 下 面 先 给 出 Q 到 NN 
的 一 个 对 应 ， 这 证 明了 Q 是 可 数 的 ， 从 而 也 就 证 明了 本 结论 。 给 出 一 个 Q N 的 对 应 的 简 
单方 法 是 : 先 列 出 Q 的 所 有 元 素 ， 然 后 将 此 序列 中 的 第 一 个 元 素 与 N 中 的 1 配对 ， 将 第 二 个 
元 素 与 2 配对 ， 依 此 类 推 。 注意， 必须 保证 Q 中 的 每 个 元 素 在 此 序列 中 只 出 现 一 次 。 

为 得 到 这 样 的 序列 ， 构 造 下 面包 含 所 有 正 有 理 数 的 矩阵 ， 如 图 4- 3 所 示 。 第 i 行 包含 


所 有 分 子 为 ; 的 数 ， 第 7 列 包含 所 有 分 母 为 j 的 数 。 故 出 现在 第 i 行 和 第 j 列 交叉 处 ， 


1 k i 
\ \ i 
‘> 








"Bh 


图 4-3 N 与 Q 的 对 应 


现在 将 此 矩阵 转化 成 一 个 序列 。 一 个 〈 行 不 通 的 ) 思路 是 : 序列 以 第 一 行 的 所 有 元 素 
开始 。 但 因为 第 一 行 是 无 限 的 ， 序 列 将 不 会 到 达 第 二 行 ， 故 此 思路 不 好 。 换 用 下 面 的 方 
法 : 从 角落 开始 ， 排 列 在 对 角 线 上 的 所 有 元 素 ， 这 些 对 角 线 已 经 附加 在 图 4- 3 中 。 第 一 条 


对 角 线 只 包含 一 个 元 素 了 ,第 二 条 对 角 线 包含 两 个 元 素 了 和 亏 ， 所 以 此 序列 的 前 三 个 元 素 


wie cm 
心 | 


SS 
TRAS 
S 
~ ae de GS 


NI iD 


是 了 ,了 和 志 。 第 三 条 对 角 线 上 有 麻烦 ， 它 包含 了 ， 纪 和 十。 如 果 简单 地 将 它们 加 到 序列 


中 ， 就 重复 了 二 一 元 。 为 避免 重复 ， 忽 略 引起 重复 的 元 素 。 所 以 仅仅 加 入 两 个 新 元 素 卫 和 


地 。 以 这 种 方法 继续 下 去 ， 就 得 到 Q 的 所 有 元 素 的 一 个 序列 。 a 


RLF THEE 129 


看 过 N 与 Q 的 对 应 之 后 ， 你 也 许 会 认为 ， 可 以 证 明 任 意 两 个 无 限 集合 都 有 相同 规模 。 毕 
竟 只 要 给 出 一 个 对 应 即 可 ， 这 个 例子 也 说 明了 确实 存在 某 些 不 可 思议 的 对 应 。 但 是 ， 还 是 有 
一 些 集合 因为 太 大 了 ， 故 没有 与 N 的 对 应 。 这 样 的 集合 称 为 不 可 数 的 〈uncountable) 。 

实数 集 便 是 一 个 不 可 数 集合 的 例子 。 实 数 (real number) 是 用 十 进 制 表示 的 数 。 数 
r 一 3. 1415926… 和 V2 =1. 4142135… 都 是 实数 。 设 R 是 实数 集合 。 康 托 证 明了 R 是 不 可 数 
的 。 下 面 用 对 角 线 方法 证 明之 。 

CEED REKTKH. 

证 明 ”为 证 明 R 是 不 可 数 的 ， 必 须 证 明 在 N 与 及 之 间 不 存在 对 应 。 下 面 用 反 证 法 证 
明之 : BREN 与 R 间 存 在 对 应 f/， 现 在 的 任务 是 证 明 它 没有 应 有 的 性 质 。 因 为 它 是 一 个 
对 应 ， 所 以 必 能 将 N 的 所 有 元 素 与 R 的 所 有 元 素 进行 配对 。 如 果 能 找到 R 中 的 一 个 zx 和 
N 中 的 任何 元 素 都 不 能 配对 ， 则 找到 了 了 矛盾 。 

为 此 ， 实 际 构造 出 这 样 一 个 xz。 方法 为 : 在 选择 它 的 
每 一 位 数字 时 ， 都 使 得 x 不 同 于 某 个 实数 ， 且 此 实数 已 与 表 4-2 假定 存在 的 N 与 
N 中 一 个 元 素 配 对 。 这 样 就 能 保证 x 不 同 于 任何 已 配对 的 R 间 的 对 应 f 
实数 。 

用 一 个 例子 来 说 明 这 个 思路 。 假 设 对 应 f PFE, HR 
f(1)=3.14159-, f (2)=55. 555551, f(3) =, SS, 
则 fK AIR% 1 与 3.14159… 配 对 ， 将 2 5 55.55555- fe 
对 ， 依 此 类 推 。 表 4-2 给 出 了 此 假定 存在 的 f 的 一 些 值 ，f 
联系 了 NAIR. 

只 要 给 出 z 的 十 进 制 表示 ， 则 z 就 可 以 构造 出 来 。 所 构造 的 zx 是 在 0 与 1 之 间 的 一 个 
数 ， 所 以 重要 的 是 小 数 点 后 面 的 数字 。 要 保证 对 每 个 n 都 有 xz 天 fl(n)。 为 保证 x 关 f(1)， 
只 要 保证 r 的 第 一 位 小 数 不 同 于 f(1) = 二 3.14159… 的 第 一 位 小 数 ， 即 不 是 数字 1， 随 意 地 
令 它 为 4。 为 保证 zx 关 f(2)， 只 要 保证 zz 的 第 二 位 小 数 不 同 于 f (2) =55. 555555… 的 第 二 
位 小 数 ， 即 不 是 数字 5， 任 意 地 令 它 为 6; f£(3)=0.12345-- 

的 第 三 位 小 数 是 3， 故 可 取 zx 的 第 三 位 小 数 是 任 一 个 不 为 3 hil ERTE 

的 数字 ， 比 如 4。 沿 着 表 4- 2 中 f 的 对 角 线 ， 以 这 种 方法 
继续 下 去 ， 就 能 够 得 到 z 的 所 有 数字 ， 如 表 4- 3 所 示 。 不 
难 知道 ， 对 任意 n，z 都 不 是 SO, AAzcS fm ER n 
个 小 数位 上 不 同 。( 有 一 个 小 问题 。 有 些 数 ， 如 0. 1999… 和 
0. 2000…， 虽 然 它们 的 十 进 制 表示 不 同 ， 但 它们 却 相 同 。 
只 要 在 构造 x 时 不 选 数字 0 和 9， 就 可 避免 这 个 问题 。) Oe 

上 述 定 理 对 计算 理论 有 着 重要 的 应 用 ， 它 表明 有 些 语言 是 不 可 判定 的 ， 甚 至 不 是 图 灵 
可 识别 的 ， 原 因 是 : 有 不 可 数 个 语言 ， 却 只 有 可 数 个 图 灵机 。 由 于 一 个 图 灵机 只 能 识别 一 
个 语言 ， 而 语言 比 图 灵机 更 多 ， 故 有 些 语言 不 能 用 任何 的 图 灵机 识别 。 这 样 的 语言 就 不 是 
图 灵 可 识别 的 ， 正 如 下 面 推论 所 说 。 

AED 存在 不 能 被 任何 图 灵机 识别 的 语言 。 

证 明 为 证 明 所 有 图 灵机 构成 的 集合 是 可 数 的 ， 首 先 证 明 : 对 任意 的 字母 表 53， 其 上 
RABIES 5* 是 可 数 的。 这 是 因为 ， 对 每 个 自然 数 n， 长 度 为 n 的 串 只 有 有 限 多 个 。 









3. 14159.* 
59.099904 
0. 123455°" 
0. 500000». 


. "= Ww bo ret =< 











3. 14159- 
55.55555…. 
0. 123455… 工 一 0. 4641+ 
0. 50000… 
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我 们 先 写 下 长 度 为 0 的 所 有 串 ， 再 写 下 长 度 为 1 的 所 有 串 ， 再 写 下 长 度 为 2 KMAR, W 
此 类 推 ， 这 样 就 能 构造 出 3* 的 序列 。 

由 所 有 图 灵机 构成 的 集合 是 可 数 的 ， 原 因 是 : 每 个 图 灵机 有 一 个 编码 ， 它 是 一 个 串 
(My) 。 只 要 去 掉 那 些 不 是 图 灵机 合法 编码 的 串 ， 就 得 到 了 所 有 图 灵机 的 序列 。 

为 证 明 由 所 有 语言 构成 的 集合 是 不 可 数 的 ， 首 先 证 明 由 所 有 无 限 二 进 制 序 列 构成 的 集 
合 是 不 可 数 的 。 所 谓 的 无 限 二 进 制 序列 是 指 由 0 或 1 构成 的 无 限 序列 。 以 8 记 所 有 无 限 二 
进 制 序列 构成 的 集合 。 可 以 通过 对 角 化 方法 来 证 明 B 是 不 可 数 的 ， 此 法 类 似 于 定理 4. 14 
所 用 的 方法 ， 只 不 过 那 时 是 证 明 R 是 不 可 数 的 。 

设 C 是 字母 表 王 上 所 有 语言 的 集合 。 只 要 给 出 L 与 8 的 一 个 对 应 ， 就 证 明了 这 两 个 
集合 有 相同 的 规模 ， 也 就 证 明 C 是 不 可 数 的 。 设 3* =—(515525535°}. BAR ACLE B 
中 都 有 唯一 的 一 个 相应 序列 : 如 果 s;€ A， 则 此 序列 的 第 i 位 为 1; 如 果 s; EA, WIA 
的 第 i 位 为 0。 此 序列 被 称 为 A 的 特征 序列 (characteristic sequence)。 例 如 ， 如 果 A EF 
母 表 (0, 1) 上 以 0 开始 的 串 构成 的 语言 ， 则 其 特征 序列 y, JE: 

2 s= le0s 1 00301, 10811 .000 001075}3 
A= 0, O0,01, 000,001,°**}; 
X = 010110011- 

SRA f:L 一 8 为: f(A) 是 A 的 特征 序列 ， 则 f 是 一 对 一 且 满 映射 的 ， 即 是 一 个 对 
应 。 因 为 8B 是 不 可 数 的 ， 故 L 也 是 不 可 数 的 。 

至 此 ,已 证 明了 所 有 语言 的 集合 与 所 有 图 灵机 的 集合 之 间 不 能 有 对 应 。 因 此 可 以 下 结 
论说 : 存在 不 能 被 任何 图 灵机 识别 的 语言 。 s 


4.2.2 不 可 判定 语言 


至 此 ， 我 们 已 为 证 明定 理 4. 9 做 了 充分 准备 ， 现 在 证 明 下 列 语言 的 不 可 判定 性 : 
ATM 一 ((M,w)|M 是 一 个 图 灵机 ，, 且 M 接受 w) 
证 明 假设 Ar 是 可 判定 的 ， 下 面 将 由 之 导出 下 盾 。 设 互 是 Ar 的 判定 器 。 令 M 是 
一 个 图 灵机 ，w 是 一 个 串 。 在 输入 (Mow) E, wR M 接受 w， 则 五 就 停机 且 接 受 w; 
如 果 M 不 接受 w， 则 H 也 会 停机 ， 但 拒绝 w。 换 句 话 说 ， 严 是 一 个 图 灵机 ， 使 得 : 
H((M,w)) = 接受 ”如果 M 接受 也 
拒绝 wRMAB Rw 
现在 来 构造 一 个 新 的 图 灵机 D, CA 瑟 作为 子 程序 。 当 M 被 输入 它 自己 的 描述 〈M) 
时 ， 图 灵机 DRAB, AOS RM 将 做 什么 。 一 旦 得 到 这 个 信息 ，D 就 反 着 做 ， 即 : 如 
果 M 接受 ， 它 就 拒绝 ; 如 果 M 不 接受 ， 它 就 接受 。 下 面 是 DD 的 描述 。 
D= 二 “对 于 输入 〈“M);， 其 中 M 是 一 个 图 灵机 : 
1. ÆA (M,<(M)) 上 运行 H. 
2. 输出 与 五 输出 的 相反 结论 ， 即 如 果 HRS, Mee; WR AH, MHZ.” 
不 要 被 “在 一 个 机 器 上 运行 它 自己 的 描述 ”这 个 表示 法 所 困扰 ， 这 类 似 于 以 一 个 程序 
本 身 作 为 输入 来 运行 这 个 程序 ， 这 在 实际 中 确实 时 有 发 生 。 例 如 ， 编 译 占 是 翻译 其 他 程序 
的 程序 。Python 语言 的 编译 器 也 许 就 是 以 Python 写 的 ， 所 以 “在 一 个 程序 本 身上 运行 这 
个 程序 ”是 有 意义 的 。 和 总 而 言 之 ， 
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接受 如果 M 不 接受 (M) 

拒绝 ”如果 M 接受 (M) 

“UD 的 描述 “D〉 作 为 输入 来 运行 D 自身 时 ， 结 果 会 怎样 呢 ?” 我 们 得 到 : 

k wR DTD) 

拒绝 wR D 接受 (D) 

不 论 做 什么 ， 它 都 被 迫 相 反 地 做 ， 这 显然 是 一 个 矛盾 。 所 以 ， 图 灵机 D 和 图 灵机 五 都 

不 存在 。 = 
回顾 一 下 上 述 证 明 步 又 。 先 假设 图 灵机 H 判定 Artm; 然后 用 五 来 构造 一 个 图 灵机 

DD， 它 接受 输入 〈M7 ， 当 且 仅 当 M 不 接受 输入 〈《M?;， 最 后 在 卫 目 身上 运行 忆 。 因 此 ， 这 

HE ALAS ACHE FIDE : 

。 HERZ (Mow) SHN MĚZ w. 

e DE% (M), 4HM4 M 接受 M}. 

e DE (D), 4HM4 DHX (D). 

最 后 一 行 是 矛盾 的 。 

在 定理 4.9 的 证 明 中 ， 什 么 地 方 有 对 角 化 呢 ? 只 要 检查 一 下 图 灵机 HAA RPL D 的 
行为 表 就 清楚 了 。 在 这 些 表 中 ， 将 所 有 图 灵机 Mi ,Mz ,… 沿 列 方向 排列 ， 将 它们 的 描述 
(Mi )，(Mz)，… 沿 行 方 向 排列 。 表 值 说 明了 所 在 行 中 的 机 器 是 否 接受 所 在 列 中 的 输入 ， 
如 接受 ， 则 表 值 为 accept; 如 拒绝 或 在 此 输入 上 循环 ， 则 表 值 为 空白 。 图 4-4 编排 了 所 有 
的 表 值 以 说 明 上 述 想法 : 

而 在 图 4- 5 中 ， 表 值 是 H 的 运行 结果 ， 其 输入 与 图 4- 4 对 应 位 置 一 致 。 例 如 ， 如 果 
Ms 不 接受 输入 《M2 );， 则 在 第 Ms 行 和 第 〈Msz 》 列 交叉 处 的 表 值 是 reject， 因 为 H 拒绝 
输入 《Ms ,(Msz  ) 。 


DaM» =| 


DCCD)) 一 | 








(M) (M2) (Ms) (Ma) -> (Mi) (M2) (M3) (Ma) 

M, | accept accept Mı | accept reject accept reject 
Mz | accept accept accept accept M2 | accept accept accept accept _ 

M3 M3 | reject reject reject reject 

_ accept accept reject reject 


Ma | accept accept Ma 


图 4-4 如 果 M; 接受 〈M;)， 图 4-5 (i,7) WREE HERA 
WW (i,j) 的 表 值 是 accept (Mi ,《M;)〉 上 的 值 


图 4-6 是 在 图 4- 5 中 加 入 D. REBER, 日 是 一 个 图 灵机 ， 所 以 D 也 是 一 个 图 灵机 ， 
因此 必定 在 所 有 图 灵机 的 序列 Mi ,M2 ,… 中 出 


(Mi) (Ma) (Ms) (Ma) +++ (D) 




















现 。 注 意 , D $È Xt 角 线 K {AL 的 相反 值 H 算 > Mi | accept reject accept reject accept 
. 7 a Mz | accept accept accept accept accept 
在 [A] 号 处 p Æ x 盾 ’ 那 里 的 表 值 WY 须 与 已 = Mz | reject reject reject reject reject 
g 相 反 Ma | accept accept reject reject accept 
42.3 一 个 Fe AN 可 18 别 | 语 言 D | reject reject accept accept ? 
上 市 介绍 了 一 个 不 可 判定 的 语言 : Am. 
现在 介绍 另 一 个 语言 ， 此 语言 甚至 不 是 图 灵 图 4-6 WẸ DEA Pa, 


可 识别 的 。 注 意 ，Arw 还 不 是 这 样 的 语言 ， EASE EA E 
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为 已 经 证 明 Arw 是 图 灵 可 识别 的 。 下 面 的 定理 表明 : 如 果 一 个 语言 和 它 的 补 都 是 图 灵 可 识 
别 的 ， 则 此 语言 也 是 可 判定 的 。 这 样 ， 对 任何 不 可 判定 语言 ， 它 或 它 的 补 至 少 有 一 个 不 是 
图 灵 可 识别 的 。 回 想 一 下 ， 一 个 语言 的 补 是 由 不 在 此 语言 中 的 所 有 串 构 成 的 语言 。 如 果 一 个 
语言 是 一 个 图 灵 可 识别 语言 的 补 集 ， 则 称 它 是 补 图 灵 可 识别 的 〈co-Turing-recognizable) 。 

《CEI 王 四 ”一 个 语言 是 可 判定 的 ， 当 且 仅 当 它 既 是 图 灵 可 识别 的 ， 也 是 补 图 灵 可 识 
别 的 。 

换 句 话说 ， 一 个 语言 是 可 判定 的 ， 当 且 仅 当 它 和 它 的 补 都 是 图 灵 可 识别 的 。 

证 明 ”要 证 明 两 个 方向 。 首 先 ， 如 果 A 是 可 判定 的 ， 很 容易 看 出 A 和 它 的 补 A 都 是 
图 灵 可 识别 的 ， 因 为 任何 可 判定 语言 都 是 图 灵 可 识别 的 ， 且 任何 可 判定 语言 的 补 也 是 可 判 
定 的 。 

下 面 证 另 一 个 方向 。 如 果 A 和 A 都 是 图 灵 可 识别 的 , OM 是 ARRIR, M 是 A 
的 识别 器 。 下 列 图 灵机 M 是 A 的 判定 器 : 

M 一 “对 于 输入 w: 

1. 在 输入 w 上 并 行 运 行 M1 M M2. 
2. WR Mi 接受 ， 就 接受 ; 如 果 M: 接受 ， 就 拒绝 。” 

并 行 地 运行 两 个 机 器 指 的 是 : M 有 两 个 带 ， 一 个 模拟 Mi ， 另 一 个 模拟 Ma 。 此 时 ，M 
交替 地 模拟 两 个 机 器 的 一 步 ， 一 直 持 续 到 其 中 之 一 接受 。 

现在 证 明 M 确实 判定 A。 任 一 个 串 ww 要 么 在 A H, HAEA., HMA, Mi 和 Ms 
必定 有 一 个 接受 w., KARE Mi 或 Ms 接受 ，M 就 停机 ， 所 以 M 总 会 停机 ， 因 而 它 是 个 
判定 器 。 还 有 ，M 接受 所 有 在 A 中 的 串 ， 拒 绝 所 有 不 在 A PHR, MEA 的 判定 器 ， 
因而 A 是 可 判定 的 。 本 

ATM 不 是 图 灵 可 识别 的 。 

证 明 Arw 是 图 灵 可 识别 的 。 如 果 Arw 也 是 图 灵 可 识别 的 ， 则 Arw 将 是 可 判定 的 。 但 
定理 4. 9 说 Ar 不 是 可 判定 的 ， 所 以 Ar 肯定 不 是 图 灵 可 识别 的 。 2 


练习 
4.1 对 于 下 图 所 示 的 DFA M， 回 答 下 列 问题 ， 并 说 明理 由 。 





a. (M,0100) € Apra? b. (M,011) E Apra? 
c. (M) € Apra? d. (M,0100) € Arex? 
e. (M) E Epra? f. (M,M) € EQpra? 
4.2 考虑 一 个 DFA 和 一 个 正则 表达 式 是 否 等 价 的 问题 。 将 这 个 问题 表述 为 一 个 语言 并 证 明 它 是 可 判 
定 的 。 


4.3 t ALLpra ={(A)|A #—~* DFA, H L(A)=3* }. 证 明 ALLprFA 是 可 判定 的 。 


4.4 


A4.5 
4.6 


4.7 


4.8 
4.9 
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it Acces = {(G) |G 是 一 个 生成 e 的 CFG). 证明 Aca ET AEH. 

设 Erm = 二 {(M) |M 是 一 个 图 灵机 ,上 且 LOW =2). 证明 Erm 的 补 Erm 是 图 灵 可 识别 的 。 
设 X 是 集合 {1,2,3,4,5},，Y 是 集合 (6,7,8,9,10}. 

以 表 4-4 描述 函数 f:X>Y 和 函数 g:X~Y。 回 答 下 列 met ERTI 
每 一 个 问题 ， 并 对 给 出 否定 的 答案 说 明理 由 。 

Na. ff 是 一 对 一 的 吗 % Ad. g 是 一 对 一 的 吗 ? 
b. f 是 满 映射 的 吗 ? e.g 是 满 映 射 的 吗 ? 
c. f 是 对 应 的 吗 ? f. g 是 对 应 的 吗 ? 
BE {0,1} 上 所 有 无 限 序 列 的 集合 。 用 对 角 化 方法 
证 明 B 是 不 可 数 的 。 


设 T={(i,j,k)|i,j,kEN}。 证 明代 是 可 数 的 。 
回想 一 下 定义 4. 10 中 采用 的 定义 集合 具有 相同 规模 的 方法 ， 并 证 明 “ 有 相同 规模 ”是 一 个 等 价 





引 理 2. 25 的 证 明 中 提 到 对 DPDA P， 当 PP 从 状态 gq F, caern 是 栈 顶 符号 时 ， 若 它 从 不 
弹出 任何 xz 以 下 的 符号 ， 也 不 读 和 人 任何 输 入 符号 ， 则 称 Cr) 是 looping RA. X F={(P,q, 
ZX)1(g,X) 是 一 个 对 于 P 的 looping 状况 },， 证 明正 是 可 判定 的 。 

对 于 CFL G 中 的 变 元 A ， 如 果 它 在 某 个 字符 串 w(wE G) 的 派生 中 出 现 ， 则 称 A 是 可 用 的 《us- 
able) 。 给 定 一 个 CFG G 和 一 个 变 元 A ， 考 虑 测试 A 是 否 为 可 用 的 这 样 一 个 问题 。 将 该 问题 形 
式 化 为 一 个 语言 ， 并 证 明 它 是 可 判定 的 。 

设 A 是 由 某 些 图 灵机 的 描述 构成 的 一 个 图 灵 可 识别 语言 {(Mi ),(Mz ),…}， 其 中 每 个 M; 都 是 
判定 器 。 求 证 :; 铬 判定 器 Mi 的 描述 在 A 中 ， 那 么 存在 可 判定 语言 D, 但 它 不 能 被 任何 M; 所 判 
定 。( 提 示 : 考虑 A 的 一 个 枚 举 器 或 许 有 用 。) 

设 Cere =((G,k) |G 是 一 个 CFG, 且 工 (G) 恰 好 包含 & 个 字符 串 ,其 中 RO M R=}, 证 明 Cere 
是 可 判定 的 。 

设 C={(G,z)1G 是 一 个 CFG,z 是 某 个 yEEL(CG) 的 子 串 }， 证 明 C 是 可 判定 的 。 (提示 : 使 用 
Ecrc 的 判定 需 是 个 好 方法 。) 

设 下 = {(M) | M 是 一 个 DFA， 它 接受 1 比 0 多 的 串 }， 证明 五 是 可 判定 的 。( 提 示 : 一 些 关于 
CFL 的 定理 对 此 会 有 帮助 。) 

设 PALoa = { (M) |M 是 一 个 接受 某 些 回 文 的 DFA}, 证 明 PALom 是 可 判定 的 。 (提示 : 一 些 关 
于 CFL 的 定理 对 此 会 有 帮助 。) 

i BALora = { (M) | M 是 一 个 DFA， 它 接受 含有 相同 个 数 的 0 和 1 的 串 }， 证 明 BALors 是 可 
判定 的 。( 提 示 : 一 些 关于 CFL 的 定理 对 此 会 有 帮助 。) 

下 推 自动 机 的 一 个 无 用 状态 (useless state) 是 指 在 任何 输入 上 都 不 会 进入 的 状态 。 考 虑 检查 一 
个 下 推 自动 机 是 否 有 无 用 状态 的 问题 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 可 判定 的 。 

对 于 那些 可 以 从 两 个 不 同 计 算 分 支 接受 某 些 字符 串 的 NFA， 称 其 是 有 二 义 的 (ambiguous)。 设 
AMBIGyr, = {(N)|N 是 一 个 有 二 义 的 NFA}, WEH AMBIGwr 和 是 可 判定 的 。( 建 议 : 一 种 较 好 的 
解决 方法 是 先 构 造 一 个 适当 的 DFA， 然 后 在 其 上 运行 Erao) 

设 S={(M)|M # DFA, A RRS w, MRS w"). WEA S 是 可 判定 的 。 

设 PREFIX-FREErex 二 {RIR 是 一 个 正则 表达 式 , 且 L(R) 是 前 级 无 关 的 }。 证 明 PREFIX-FREE px P 
判定 的 。 为 什么 相似 的 方法 无 法 证 明 PREFIX-FREEcrc 是 可 判定 的 ? 

设 A 和 B 是 两 个 不 交 的 语言 。 称 语言 CBB (separate) AMB, w ACC H BCC, 证 明 任 意 
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两 个 不 交 的 补 图 灵 可 识别 语言 都 可 由 某 个 可 判定 语言 分 离 。 

证 明 可 判定 的 语言 类 在 同 态 下 不 封闭 。 

设 C 是 一 个 语言 。 证 明 C 是 图 灵 可 识别 的 ， 当 且 仅 当 存 在 一 个 可 判定 语言 D, 使 得 C=={x| dy 
Crs w E D) Fe 

检查 两 个 DFA 在 规模 小 于 或 等 于 某 个 数 的 所 有 串 上 的 运行 ， 并 以 此 方法 证 明 EQpes 是 可 判定 的 。 
计算 这 样 的 一 个 数 。 

WA= (PIR 是 一 个 正则 表达 式 ， 其 所 描述 的 语言 中 至 少 有 一 个 串 w 以 111 为 子 串 〈 即 有 zx 和 
y 使 得 ww 二 x111y)}。 证 明 A 是 可 判定 的 。 

证 明确 定 一 个 CFG 是 否 生 成 1* 中 的 所 有 串 的 问题 是 可 判定 的 。 换 言 之 ,证 明 {(G)|G 是 {0,1) 
EM—*+ CFG,H1*CL(G)} 是 一 个 可 判定 语言 。 

w= 40，1)， 证 明确 定 一 个 CFG 是 否 生成 1* 中 的 串 的 问题 是 可 判定 的 。 换 言 之 ， 证 明 {(G)| 
G 是 {0,1} 上 的 一 个 CFG， 且 1x 站 L(G) 关 名 } 是 一 个 可 判定 语言 。 

设 A={《(R,S)|R 和 S 是 正则 表达 式 ， 且 L(R)CL(S)}, 证 明 A 是 可 判定 的 。 

w A= { (M) | M 是 DFA， 它 不 接受 任何 包含 奇数 个 1. 的 串 }， 证明 A 是 可 判定 的 。 

it INFINITEpp, = {(M)|M 是 一 个 PDA, H L(M) 是 一 个 无 限 语言 )。 证 明 INFINITE Æ n #1 
定 的 。 

设 INFINITE ={(A)|A 是 一 个 DFA, 且 L(A) 是 一 个 无 限 语言 )}。 证 明 INFINITE Æ T # 
定 的 。 


习题 选 解 


4. 1 


4.5 


4.6 


a. 是 。DFA M## 0100, b. 否 。M 不 接受 011. 
c. 否 。 输 入 只 有 一 个 组 成 部 分 ， 因 此 形式 不 正确 。 
d 否 。 前 半 部 分 不 是 正则 表达 式 ， 因 此 输入 的 形式 不 正确 。 
e 否 。M 的 语言 非 空 。 f 是 。M 接受 和 它 自身 相同 的 语言 。 
设 s,s;，,… 是 5 上 的 所 有 字符 串 。 下 述 图 灵机 识别 Erm 。 
“IIFA M), KF M 是 一 个 图 灵机 : 

1. 对 i 二 1,2,3,… ,重复 下 面 步骤 。 

2. 在 每 个 输入 5 ,ss，,…,s; 上 ，M 运行 i H. 

3. WR M 接受 了 其 中 任意 一 个 ， 则 接受 。 否 则 ， 继 续 。” 
a 否 。 因 为 f(1)= 二 f(3)， 所 以 f 不 是 一 对 一 的 。 
d Æ. g 是 一 对 一 的 。 
由 所 有 具有 相同 个 0 和 1 的 字符 串 构 成 的 语言 是 一 个 上 下 文 无 关 语 言 ， 可 以 由 文法 S 一 1S0S | 
0S1S|e 来 生成 。 设 PP 是 可 识别 该 语言 的 一 个 PDA， 构 造 一 个 BALbss 的 图 灵机 M， 其 操作 过 程 如 
F: 对 于 输入 《“B;， 此 处 B 是 一 个 DFA， 用 B 和 P 构造 一 个 新 的 PDA R， 它 能 够 识别 属于 B 和 
P 的 语言 的 交集 ; 然后 测试 R 的 语言 是 否 为 空 ， 如 果 该 语言 为 空 ， 则 拒绝 ， 否 则 ， 接 受 。 
下 面 的 过 程 将 判定 AMBIGNwA 。 对 于 给 定 的 NFA N， 可 以 设计 一 个 DFA DREAN, SHAM 
N 沿 着 两 个 不 同 计算 分 支 接受 某 串 时 ，D 接受 该 串 。 然 后 用 Eprs 的 判定 器 来 确定 D 是 否 接 受 所 有 
的 串 。 

构造 D 的 方法 类 似 于 在 定理 1. 19 的 证 明 中 从 NFA 到 DFA 的 变换 过 程 。 我 们 通过 在 每 个 活 
动 状态 上 摆 放 小 石子 的 方法 来 模拟 N。 首 先 ， 在 初始 状态 以 及 与 初始 状态 沿 s 转移 可 到 达 的 状态 
上 摆 放 一 个 红色 的 石子 ， 然 后 按照 N 的 变迁 过 程 ， 移 动 、 添 加 、 去 掉 石子 ， 并 保持 这 些 石子 的 颜 
色 。 不 论 何 时 ， 只 要 有 两 个 或 两 个 以 上 的 石子 移动 到 同一 状态 上 ， 就 把 这 些 石子 换 为 蓝 色 的 。 当 
读 完 输入 后 ， 如 果 是 蓝 色 的 石子 在 N 的 接受 状态 ,或 者 有 红色 石子 在 N 的 两 个 不 相同 的 接受 状 
态 上 ， 则 接受 。 


4. 28 


4. 30 


4. 32 
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DFA D 的 状态 对 应 于 石子 的 每 种 可 能 的 位 置 。 对 于 N， 每 个 状态 都 有 三 种 可 能 : 其 上 所 放 的 
是 红色 石子 、 蓝 色 石 子 或 是 没有 石子 ， 因 此 ， 如 果 N 有 个 状态 的 话 ，D 将 有 3" 个 状态 。 我 们 
定义 了 它 的 初始 状态 、 接 受 状 态 和 转移 函数 来 实现 模拟 。 
参考 问题 2. 30， 如 果 C 是 上 下 文 无 关 语 言 且 R 是 正则 语言 ， 那 么 CN 站 R 是 上 下 文 无 关 的 。 因 此 
1 NALIGO 是 上 下 文 无关 的 。 下 面 的 图 灵机 判定 这 个 问题 的 语言 。 
“对 于 输入 (G): 

1. fx CFG H, W4 LC H)=1"* L(G). 

2. 用 定理 4. 7 中 Ecro 的 判定 器 R 测试 是 否 L(H) 二 名 。 

3. WR R 接受 ， 则 拒绝 ; 如 果 R 拒绝 ， 则 接受 。” 
下 面 的 图 灵机 判定 A 
“对 于 输入 <M): 

1. 构造 一 个 DFA O 接受 每 个 包含 奇数 个 INE. 

2. 构造 DFA B, {#14 LCOB)=LICM) NLO). 

3. 使 用 定理 4.4 中 Epra 的 判定 器 全 测试 是 否 L(B) 二 名。 

4. 如 果 工 接受 ， 则 接受 ; 如 果 工 拒绝 ， 则 拒绝 。” 
FAHARI TŽ INFINITE ra o 
T 一 “对 于 输入 〈A) ， 此 处 A 是 一 个 DFA， 
. 令 & 是 A 的 状态 数 。 
. 构造 一 个 DFA D， 接 受 所 有 长 度 不 小 于 的 串 。 
. 构造 一 个 DFA M, (#48 L(M)=L(A) N L(D). 
. 使 用 定理 4.4 Era FE HET, Wik LCM =2. 
. 如 果 工 接受 ， 则 拒绝 ; WR TE, WMZ.” 
这 个 算法 是 可 行 的 ， 因 为 可 以 接受 无 限 多 个 串 的 DFA 必定 可 以 接受 任意 长 的 串 。 因 此 该 算法 
能 够 接受 这 样 的 一 些 DFA, RZ, Wk HA DFA 的 状态 数 ， 则 如 果 该 算法 接受 一 个 DFA， 那 么 此 
DFA 可 接受 长 度 为 k 或 大 于 的 串 。 而 这 个 串 也 许 能 够 用 正则 表达 式 的 泵 引 理 所 抽出 ， 从 而 获得 
无 限 多 个 接受 的 串 。 
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可 归 约 性 





在 第 4 章 已 经 确定 采用 图 灵机 作为 通用 计算 机 的 模型 ， 并 介绍 了 几 个 在 图 灵机 上 可 解 
的 问题 ， 还 给 出 了 一 个 计算 上 不 可 解 的 问题 ， 即 Ar 。 本 章 讨论 另外 几 个 不 可 解 问题 。 在 
讨论 过 程 中 ， 将 介绍 一 个 基本 方法 ， 可 用 来 证 明 问 题 是 计算 上 不 可 解 的 ， 这 个 方法 称 为 可 
归 约 性 (reducibility)。 

归 约 (reduction) 由 在 将 一 个 问题 转化 为 男 一 个 问题 ， 且 使 得 可 以 用 第 二 个 问题 的 解 
来 解 第 一 个 问题 。 在 日 常生 活 中 ， 虽然 不 这 样 称呼 ， 但 时 常会 遇 到 可 归 约 性 问题 。 

例如 ， 在 一 个 新 城市 中 认 路 ， 如 果 有 一 张 地 图 ， 事 情 就 容易 了 。 这 样 ， 就 将 城市 认 路 
问题 归 约 为 得 到 地 图 问题 。 

可 归 约 性 总 是 涉及 两 个 问题 ， 称 之 为 A 和 B。 如 果 A 可 归 约 到 B， 就 可 用 B 的 解 来 
解 A 。 在 上 述 例子 中 ，A 是 城市 认 路 问题 ，B 是 得 到 地 图 问题 。 注 意 ， 可 归 约 性 说 的 不 是 
怎样 去 解 A 或 B， 而 是 在 知道 B 的 解 时 怎么 去 解 A。 

下 面 是 可 归 约 性 的 更 深入 的 例子 。 从 波士顿 到 巴黎 的 旅行 问题 可 归 约 到 买 这 两 个 城市 
则 的 飞机 票 问题 ， 进 而 又 可 归 约 到 挣 得 买 飞 机 票 的 钱 问题 。 此 问题 还 可 归 约 到 找 工作 
问题 。 

数学 问题 中 也 有 可 归 约 性 。 例 如 ， 测 量 一 个 矩形 的 面积 问题 可 归 约 到 测量 它 的 长 和 宽 
问题 ， 解 线性 方程 组 问题 可 归 约 到 求 矩 阵 的 逆 问 题 。 

当 根 据 可 判定 性 来 对 问题 进行 分 类 时 ， 可 归 约 性 起 着 重要 作用 。 在 本 书 的 后 面 ， 它 也 
在 复杂 性 理论 中 起 着 重要 的 作用 。 当 A 可 归 约 到 B 时 , 解 A 不 可 能 比 解 B 更 难 ， 因 为 B 
的 一 个 解 给 出 了 A 的 一 个 解 。 根 据 可 计算 性 理论 ， 如 果 A 可 归 约 到 B， 且 B 是 可 判定 的 ， 
WA 也 是 可 判定 的 。 等 价 地 ， 如 果 A 是 不 可 判定 的 ， 且 可 归 约 到 B， 则 B 也 是 不 可 判定 
的 。 后 者 在 证 明 许多 问题 的 不 可 判定 性 时 起 着 关键 作用 。 

简单 地 说 ， 下 面 方法 可 用 来 证 明 一 个 问题 是 不 可 判定 的 : 先 证 明 另 外 一 个 问题 是 不 可 
判定 的 ， 再 将 此 问题 归 约 到 它 。 


5.1 语言 理论 中 的 不 可 判定 问题 


ATrM 是 不 可 判定 的 ， 即 确定 一 个 图 灵机 是 否 接受 一 个 给 定 的 输入 问题 是 不 可 判定 的 。 
下 面 考虑 一 个 与 之 相关 的 问题 ， 有 HALTrm， 即 确定 一 个 图 灵机 对 给 定 的 输入 是 否 停 机 GH 
过 接受 或 拒绝 ) 问题 。 这 个 问题 被 称 为 停机 问题 (halting problem)。 若 将 Atm 归 约 到 
HALT ™m, RA AFA Ar 的 不 可 判定 性 来 证 明 停 机 问题 的 不 可 判定 性 。 设 

HALT m={(M,w)|M#—4BA RAL, BMRA wH} 

HALT MAA TH ZH. 

证 明 思路 ”用 反 证 法 。 假 设 HALTrmw 是 可 判定 的 ， 下 面 用 这 个 假设 来 证 明 Arw 是 可 
判定 的 ， 这 与 定理 4. 9 矛盾 。 关 键 步 骤 是 证 明 Atrm 可 归 约 到 HALT. 

假设 图 灵机 R 判定 HALTTtMm。 利 用 R 可 以 构造 一 个 判定 Artw 的 图 灵机 S。 为 了 感受 
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构造 S 的 方法 ， 假 设 你 就 是 S， 你 的 任务 是 判定 Am., 4AMR—-TEM (M, w) 的 输入 
时 ， 如 果 M 接受 w， 你 必须 输出 接受 ; 如 果 M 进入 循环 或 拒绝 ww， 你 必须 输出 拒绝 。 当 
你 在 w 上 试 着 模拟 M 时 ， 如 果 它 接受 或 拒绝 ， 你 可 以 照 着 做 。 但 是 你 不 能 确定 M 是 否 在 
循环 ， 并 且 当 M 循环 时 ， 你 的 模拟 将 不 会 终止 。 这 下 坏 了 ， 因 为 你 是 一 个 判定 项 ， 因 此 
不 允许 循环 。 故 这 个 思路 行 不 通 。 
现在 换 用 “有 个 判定 HALT MBAR R” 这 个 假设 。 使 用 R， 你 可 以 检查 M Hw 
是 否 停机 。 如 果 尺 指出 M 对 w F, MRE, AA M, w) DE Am. WRR H 
出 M 对 w 确实 停机 ， 你 就 模拟 它 ， 而 不 会 有 和 死 循环 的 危险 。 
这 样 ， 如 果 图 灵机 R 存在， 就 能 判定 Arx， 但 已 经 知道 Arm 是 不 可 判定 的 。 由 此 矛 
盾 即 可 得 到 “R 不 存在 ”这 个 结论 ， 从 而 HALT MEA A Fl. 
证 明 ”为 得 到 矛盾 ， 假 设 图 灵机 尺 判 定 五 ALTrx， 由 之 可 以 构造 图 灵机 S 来 判定 
Artw， 其 构造 如 下 : 
S= “EA (M, w) E, åk (Mow) 是 图 灵机 M AB w 的 编码 : 
1. 在 输入 〈M,w〉 上 运行 图 灵机 R. 
2. WR R 拒绝 ， 则 拒绝 。 
3. 如 果 R 接受 ， 则 在 w 上 模拟 M ， 直 到 它 停机 。 
4. WR M 已 经 接受 ， 则 接受 ; WR M 已 经 拒绝 ， 则 拒绝 。” 
显然 ， 如 果 R FE HALT mM, WSHCAm. ANAMEAAAEN, KH HALT ™ 
也 必定 是 不 可 判定 的 。 x 
定理 5. 1 说 明了 证 明 问 题 的 不 可 判定 性 的 方法 ， 此 方法 对 大 多 数 不 可 判定 性 证 明 都 适 
只 是 除了 Ar 本 身 的 不 可 判定 性 证 明之 外 ， 它 是 由 对 角 化 方法 直接 证 明 的 。 
为 进一步 使 用 可 归 约 性 方法 来 证 明 不 可 判定 性 ， 现 在 介绍 另外 一 些 定 理 及 相应 的 证 
AH. i 


用 


~- 


FETM 一 {((M)|M 是 一 个 图 灵机 ， 且 工 CM) 王 忆 } 

ETrM 是 不 可 判定 的 。 

证 明 思 路 ”使 用 定理 5. 1 的 反 证 法 ， 设 法 推导 出 和 矛盾。 假设 Erm 是 可 判定 的 ， 以 此 来 
证 明 Arm 是 可 判定 的 一 一 矛盾 。 设 R 是 判定 tx 的 一 个 图 灵机 ， 考 虑 怎样 用 R 来 构造 判 
定 Arw 的 图 灵机 S。 当 S 收 到 输入 〈《M,mw》 时 ， 它 应 该 怎样 运行 呢 ? 

构造 S 的 一 个 想法 是 : HMA M) 上 运行 尺 且 看 它 是 否 接受 。 如 果 是 ， 则 知道 
LIM) 是 空 集 ， 因 此 也 就 知道 M 不 接受 w。 如 果 RR 拒绝 〈‘M);， 则 能 知道 的 所 有 事情 只 是 
L(M) 不 空 ， 即 M 接受 某 个 串 ， 但 还 是 不 能 知道 M 是 否 接 受 这 个 特定 的 串 w。 故 需要 新 
的 方法 。 

MEDE (M) EZI R, 取而代之 的 是 在 〈“M〉 的 一 个 修改 型 上 运行 R。 先 修改 
(M), BRT ww 之 外 ，M 对 所 有 串 都 拒绝 ; 但 在 输入 w 上 ， 它 如 常 运行 。 现 在 ， 此 修 
改 型 所 能 识别 的 唯一 的 串 就 是 w， 故 它 的 语言 不 空当 且 仅 当 它 接受 w。 然 后 再 用 R 来 测定 
这 个 修改 型 是 否 识 别 空 语言 。 为 此 ， 向 R 提供 那个 修改 型 机 器 的 描述 ， 如 果 它 接受 ， 则 此 
修改 型 机 器 不 接受 任何 串 ， 因 而 M 也 就 不 接受 ww 

证 明 ” 先 用 标准 术语 来 写 在 证 明 思路 中 描述 的 那个 修改 型 机 器 Mi 。 

Mi 二 “在 输入 x 上: 
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1. 如 果 zx 关 w， 则 拒绝 。 
2. WR zx 二 w， 则 在 输入 w 上 运行 M， 当 M 接受 时 ， 就 接受 。” 

这 个 机 器 以 w 作为 它 的 描述 的 一 部 分 。 检 查 x 二 w 是 否 成 立 的 方法 很 显然 ， 即 扫描 输 
和 并且 一 个 字符 一 个 字符 地 将 它 与 w 进行 比较 ， 就 可 确定 它们 是 否 相 同 。 

再 假设 图 灵机 R 判定 Erm。 如 下 构造 判定 Ar 的 图 灵机 S: 

S 一 “在 输入 (M,w》 上 ， 此 处 〈‘M,w〉 是 图 灵机 M AB w 的 编码 : 

1. H MA w 的 描述 来 构造 上 述 图 灵机 Mi。 
2. 在 输入 《M1〉 上 运行 R。 
3. WR R 接受 ， 则 拒绝 ; WR REE, MHZ.” 

注意 ，S 必须 真 的 能 够 从 M A w 的 描述 来 计算 Mi 的 描述 。 它 也 确实 能 够 做 到 ， 这 是 
AA: 只 要 在 M 中 增加 一 个 额外 的 状态 来 执行 x 二 w 的 检查 即 可 。 

如 果 R 是 Erm 的 判定 器 ， 则 S 就 是 Ar 的 判定 器 。 而 Arwv 的 判定 器 是 不 存在 的 ， 故 
我 们 知道 Er 必定 是 不 可 判定 的 。 a 

另 一 个 与 图 灵机 有 关 的 计算 问题 也 很 有 意思 ， 该 问题 是 : 给 定 一 个 图 灵机 和 一 个 可 由 某 
个 更 简单 的 计算 模型 识别 的 语言 ， 测 定 此 图 灵机 是 否 识别 此 语言 。 例 如 ， 令 REGULARME 
测定 一 个 给 定 的 图 灵机 是 否 有 一 个 与 之 等 价 的 有 穷 自 动机 问题 ， 则 这 个 问题 与 测定 一 个 给 
定 的 图 灵机 是 否 识别 一 个 正则 语言 的 问题 相同 。 设 

REGULARm ={(M)|M 是 一 个 图 灵机 ,上 且 L(M) 是 一 个 正则 语言 ) 

REGULAR MÆ A TARH. 

证 明 思 路 ” 像 以 前 不 可 判定 性 定理 的 证 明 一 样 。 这 个 证 明 还 是 使 用 从 Arm h RA. 
先 假设 REGULARMEHA RPL R 判定 的 ， 再 用 这 个 假设 构造 一 个 判定 Arw 的 图 灵机 S。 现 
在 不 明显 的 是 : 怎样 使 用 尺 来 帮助 S 实现 它 的 任务 。 虽 然 不 明显 ， 但 还 是 能 够 做 到 。 

构造 S 的 思路 是 : 先 取 S 的 输入 为 “M,w)， 再 修改 M 使 得 修改 后 的 图 灵机 识别 一 个 
正则 语言 ， 当 且 仅 当 M 接受 w。 称 此 修改 后 的 图 灵机 为 M; 。 设 计 M: 使 得 : 当 M 不 接受 
w 时 ， 它 识别 非 正则 语言 (071"|\n>0}; 当 M 接受 w 时 ， 它 识别 正则 语言 3* 。 必 须 说 明 
S 是 怎样 从 M Aw 来 构造 M2 的 。 方 法 是 : M 自动 接受 所 有 在 (071"|n>0) PHB, 5 
外 ， 如 果 MERZ w, I Ms: 就 接受 所 有 其 他 的 串 。 

注意 ， 构 造 图 灵机 Ms 的 目的 并 不 是 为 了 在 某 个 输入 上 实际 地 运行 一 一 一 个 常见 的 错 
RR. Mie M: 仅仅 是 为 了 将 M: 的 描述 输入 给 假设 存在 的 REGULARTM 的 判定 器 。 一 
旦 这 个 判定 器 返回 它 的 答案 ， 那 么 就 能 根据 这 个 答案 判断 M 是 否 接受 w。 这 样 就 判定 了 
Am, XEFE. 

证 明 设 R 是 判定 REGULARTM 的 一 个 图 灵机 ， 下 面 构 造 判 定 Arw 的 图 灵机 S。S 的 
运行 方式 如 下 : 

S=“SFRA (Mow), HP M 是 图 灵机 ，w 是 串 : 

1. 构造 下 述 图 灵机 Ms : 
M: = ‘fe A x LE: 
a. WR z 具有 形式 01", WHE. 
b. 如 果 zz 不具 有 此 形式 ， 则 在 输入 w 上 运行 M。 若 M 接受 w， 则 接受 。? 
2. 在 输入 (M2) 上 运行 R。 
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3. WR R 接受 ， 则 接受 ; 如 果 尺 拒绝 ， 则 拒绝 。” a 

可 类 似 地 证 明 ， 检 查 一 个 图 灵机 的 语言 是 不 是 下 列 语言 都 是 不 可 判定 的 上下文 无 关 
语言 、 可 判定 语言 甚至 有 限 语言 。 事 实 上 ， 关 于 这 个 问题 有 一 个 更 一 般 性 的 结果 ， 称 为 赖 
斯 定理 (Rice's theorem)。 它 指出 : 测定 语言 的 任何 一 个 性 质 是 否 可 由 图 灵机 识别 都 是 不 
可 判定 的 。 问 题 5. 16 给 出 了 赖 斯 定理 。 

到 目前 为 止 ， 证 明 语 言 的 不 可 判定 性 所 用 的 方法 都 是 从 Arw 出 发 的 归 约 。 但 在 证 明 某 
些 语 言 的 不 可 判定 性 时 ， 从 另外 一 个 不 可 判定 语言 〈 如 Erm) 出 发 进行 归 约 有 时 候 更 加 方 
E. 定理 5.4 证 明 ， 检 查 两 个 图 灵机 的 等 价 性 是 一 个 不 可 判定 的 问题 。 当 然 ， 可 以 使 用 从 
ATrw 出 发 的 归 约 来 证 明 它 ， 但 下 面 给 出 一 个 从 Er 出 发 的 归 约 ， 作 为 证 明 不 可 判定 性 的 另 

一 类 型 的 例子 。 设 
EQrm ={(Mı M2) |M; 和 Ms 都 是 图 灵机 , 且 工 GCMI) 一 工 GM2 ) ) 

EQTrM 是 不 可 判定 的 。 

证 明 思 路 假设 EQrm 是 可 判定 的 。 如 果 能 给 出 从 Er 到 EQrv 的 归 约 ， 就 证 明了 
FETM 也 是 可 判定 的 。 构 造 这 个 归 约 的 思路 很 简单 ，Erwv 是 检查 一 个 图 灵机 的 语言 是 否 为 空 的 
问题 。EQrm 是 测定 两 个 图 灵机 的 语言 是 否 相 同 的 问题 。 如 果 两 个 语言 中 碰巧 有 一 个 为 空 ， 
只 要 测定 另 一 个 机 需 的 语言 是 否 为 空 即 可 ， 即 问题 Ermw。 故 当 两 个 机 器 中 有 一 个 是 用 来 识别 
空 语言 时 ， 问 题 Er 就 是 问题 EQrw 的 一 个 特例 。 这 个 想法 使 得 构造 归 约 变 得 很 容易 。 

证 明 设 图 灵机 R 判定 EQTrm。 如 下 构造 判定 Erm 的 图 灵机 S: 

S=“ FWA (M), FP M 是 图 灵机 : 

1. 在 输入 “M，Mi，〉 上 运行 R， 其 中 Mi 是 拒绝 所 有 输入 的 图 灵机 。 
2. WR R 接受 ， 则 接受 ; 如 果 尺 拒绝 ， 则 拒绝 。?” 

如 果 RAE EQm™, WS 判定 rm。 但 由 定理 5.2，ErMm 是 不 可 判定 的 。 故 EQrMm 也 

必定 是 不 可 判定 的 。 ne 


利用 计算 历史 的 归 约 


计算 历史 方法 是 证 明 ATm 可 归 约 到 某 些 语言 的 重要 技术 。 在 证 明 某 个 问题 的 不 可 判定 
性 时 ， 如 果 此 问题 涉及 检查 某 样 东西 的 存在 性 ， 则 此 方法 常常 很 用。 例如 ， 此 方法 曾 用 
来 证 明 希 尔 但 特 第 10 问题 的 不 可 判定 性 。 和 硕 尔 伯 特 第 10 问题 是 检查 一 个 多 项 式 的 整数 根 
的 存在 性 。 

图 灵机 在 输入 上 的 计算 历史 就 是 当 这 个 图 灵机 处 理 此 输入 时 所 经 过 的 格局 序列 。 它 是 
这 个 机 顺 所 经 历 的 计算 的 完整 记录 。 

设 M 是 一 个 图 灵机 ，w 是 一 个 输入 囊 。M 在 让 上 的 一 个 接受 计算 历史 
(accepting computation history) 是 一 个 格局 序列 C1,，Cs,…,Ci， 其 中 Cl 是 M 在 w EW 
起 始 格 局 ，Ci 是 MM 的 一 个 接受 格局 ， 且 每 个 Ci 都 是 Ci-1 的 合法 结果 ， 即 符合 M 的 规则 。 
M 在 w 上 的 一 个 拒绝 计算 历史 (rejecting computation history) 可 类 似 定 义 ， 只 是 Cl 应 是 
一 个 拒绝 格局 。 

计算 历史 都 是 有 限 序列 。 如 果 M 在 w 上 不 停机 ， 则 M 在 w 上 既 没 有 接受 也 没有 拒绝 
计算 历史 存在 。 确 定型 机 器 在 任何 给 定 的 输入 上 最 多 只 有 一 个 计算 历史 。 非 确定 型 机 器 即 
使 在 单个 输入 上 也 可 能 有 多 个 计算 历史 ， 它 们 与 各 个 计算 分 支 相 对 应 。 但 在 目前 ， 我 们 继 
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自动 机 的 不 可 判定 性 。 

线性 界限 自动 机 (linear bounded automaton, LBA) 是 一 种 受到 限制 的 
图 灵机 ， 它 不 允许 其 读 写 头 离开 包含 输入 的 带子 区 域 。 如 果 此 机 器 试图 将 它 的 读 写 头 移出 
输入 的 两 个 端点 ， 则 读 写 头 就 保持 在 原 地 不 动 。 这 与 普通 图 灵机 的 读 写 头 不 会 离开 带子 的 
左 端点 的 方式 一 样 。 

线性 界限 自动 机 是 只 有 有 限 存储 的 图 灵机 ， 如 图 5- 1 所 示 。 它 只 能 解 这 样 的 问题 ， 其 
所 需要 的 存储 不 得 超过 用 作 输 入 的 带子 区 域 。 使 用 一 个 比 输入 字母 表 要 大 一 些 的 带子 字母 
表 ， 就 能 使 得 可 用 存储 增加 到 常数 倍 。 也 就 是 说 ， 对 于 长 度 为 n 的 输入 ， 可 用 存储 量 关 于 
n 是 线性 的 。 这 就 是 此 模型 的 名 称 的 由 来 。 

尽管 线性 界限 自动 机 的 存储 受到 限制 ， 但 它 仍然 十 分 强 
大 。 例 如 ，ApFa，Acrc，EprA 和 Ecrc 的 判定 器 都 是 LBA. 控制 器 


每 个 CFL 都 可 由 一 个 LBA 来 判定 。 事 实 上 ， 要 提出 一 个 不 SORIN 
能 由 LBA 来 判定 的 可 判定 语言 还 需 颇 费 一 番 周 折 。 只 有 到 j 
第 9 章 时 ， 才 能 介绍 一 个 可 以 做 到 这 一 点 的 技术 。 E-l REAR H SINR 


设 ALpA 是 判定 LBA 是 否 接受 它 的 输入 的 问题 。 尽 管 Ara SAA Fle] A Arm Æ RB 

灵机 被 限制 为 LBA 时 是 相同 的 ， 我 们 还 是 可 以 证 明 ALsA 是 可 判定 的 。 设 
Arpa={(M,w)|M 是 一 个 接受 串 w 的 LBA} 

在 证 明 Arsa 的 可 判定 性 之 前 ， 证 明 下 面 的 引 理 是 有 用 的 。 它 指出 : 当 一 个 LBA 的 输 
人 是 一 个 长 度 为 n 的 串 时 ， 只 能 有 有 限 多 个 格局 。 

设 M 是 有 g 个 状态 和 g 个 带子 符号 的 LBA。 对 于 长 度 为 nn 的 带子 ，M 恰 
有 qang” 个 不 同 的 格局 。 

证 明 M 的 格局 就 像 计 算 中 间 的 一 个 快照 。 格 局 由 控制 状态 、 读 写 头 位 置 和 带子 
内 容 组 成 。 这 里 ，M 有 gq 个 状态 。 它 的 带子 长 度 是 wn， 所 以 读 写 头 可 能 处 于 个 位 置 
之 一 ， 且 g" 个 带子 符号 串 可 能 出 现在 带子 上 。 此 三 个 量 的 乘积 就 是 带 长 为 n 的 MM 的 
格局 总 数 。 a 

ALBA 是 可 判定 的 。 

证 明 思 路 ”为 了 判定 LBA M 是 否 接 受 输 入 w， 在 w 上 模拟 1M。 在 模拟 过 程 中 ， 如 果 
M 停机 且 接 受 或 拒绝 ， 则 相应 地 接受 或 拒绝 。 如 果 M 在 w 上 循环 ， 困 难 就 出 现 了 。 只 有 
知道 已 进入 循环 时 ， 才 能 停机 且 拒 绝 。 

调查 M 何 时 陷入 循环 的 思路 是 : 当 M 在 w 上 计算 时 ， 它 从 一 个 格局 进入 男 一 个 格 
局 。 如 果 M 曾经 重复 过 一 个 格局 ， 它 将 继续 一 再 地 重复 这 个 格局 ， 因 此 就 陷入 了 循环 。 
因为 M 是 一 个 LBA， 故 可 利用 的 带子 方 格 的 数量 是 有 限 的 。 由 引 理 5.7， 在 这 个 有 限量 
的 带子 上 ，M 只 可 能 处 于 有 限 多 个 格局 中 。 所 以 ， 要 使 M 不 进入 曾经 进入 过 的 任何 格局 ， 
就 只 有 有 限 多 个 格局 可 以 选择 。 引 理 5. 7 给 出 了 所 能 选择 的 最 大 格局 数 &， 通 过 在 M ER 
Hk 步 ， 就 能 知道 M 是 否 进 入 了 循环 。 如 果 到 那 时 M 还 没有 停机 ， 它 肯定 陷 人 了 循环 。 

证 明 判定 ALeA 的 算法 如 下 : 

了 一 “对 于 输入 (M,w), HP M Æ LBA, wee: 

1. 在 w 上 模拟 M qng” 步 ， 或 者 直到 它 停机 。 
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2. WR M 停 机 ， 则 当 它 接受 时 接受 ， 拒 绝 时 拒绝 。 如 果 它 还 没有 停机 ， 就 拒绝 。 

如 果 M Æw 上 运行 gng” 步 还 没有 停机 ， 根 据 引 理 5.7， 它 必定 在 重复 某 个 格局 ， 即 
陷入 了 循环 。 这 就 是 算法 为 什么 在 此 情形 下 拒绝 的 原因 。 m 

定理 5.8 说 明了 LBA 和 图 灵机 有 一 个 本 质 的 不 同 : 对 LBA， 接 受 问 题 是 可 判定 的 ， 
但 对 图 灵机 来 说 却 不 是 。 然 而 涉及 LBA 的 另外 一 些 问题 仍 是 不 可 判定 的 ， 其 中 之 一 是 空 
性 质问 题 ， 即 Erpa={<(M)|M #—~* LBA, H L(M)= 二 = 名)}。 为 证 明 ELspa 是 不 可 判定 的 ， 
要 用 计算 历史 方法 给 出 一 个 归 约 。 

ELBA 是 不 可 判定 的 。 

证 明 思 路 证明 使 用 从 Arwx 出 发 的 归 约 。 要 证 明 : 如 果 五 BA 是 可 判定 的 ， 则 Ame 
是 可 判定 的 。 现 在 假设 ErpA 是 可 判定 的 ， 怎 么 使 用 这 个 假设 来 判定 Arm YE? 

对 于 图 灵机 M 和 输入 串 w， 通 过 构造 一 个 LBA B, PRA LOB) 是 否 为 空 ， 就 可 确 
定 M 是 否 接受 w。B 识别 的 语言 包含 了 M 在 w 上 的 所 有 接受 计算 历史 。 如 果 MZ w, 
这 个 语言 就 包含 一 个 串 ， 因 此 是 非 空 的 。 如 果 M ERZ w, HARMEET. WR AE 
确定 B 的 语言 是 否 为 空 ， 显 然 就 能 确定 M 是 否 接受 w 

现在 描述 怎样 从 M A w 构造 B。 注 意 ， 不仅 需要 证 明 B 的 存在 性 ， 还 必须 证 明 一 个 
图 灵机 如 何 从 给 定 的 M Al w 的 描述 产生 B 的 描述 。 

如 同 前 面 给 出 的 不 可 判定 性 证 明 中 的 归 约 ， 构造 B 的 目的 是 为 了 将 B 的 描述 输入 给 
假设 存在 的 ELsa 的 判定 器 ， 而 不 是 在 某 个 输入 上 运行 它 。 

设 工 是 M 在 w 上 的 一 个 接受 计算 历史 ， 构 造 B， 使 之 接受 输入 x。 回忆 一 下 ，M 的 
一 个 接受 计算 历史 是 M 在 接受 某 个 串 w 时 经 历 的 格局 序列 C1 ,C2 ,…,C。 出 于 证 明 的 需 
要 ， 将 接受 计算 历史 表示 成 单个 串 ， 格 局 间 以 符号 划 相 互 阳 开 ， 如 图 5-2 所 示 。 


# --- & = 
es 


Ci C2 C3 Gi 
图 5-2 B 的 一 个 可 能 的 输入 











LBA B 按 如 下 方式 运行 。 如 果 工 是 M 在 w 上 的 一 个 接受 计算 历史 ， 则 当 B 收 到 输入 
ZX 时， 应 该 接受 。 首 先 ，B 根据 分 界 符 将 xz 分 解 为 串 C1,Cz,，…,Ci。 然 后 BRAC 是否 
满足 接受 计算 历史 的 三 个 条 件 : 

1.C1 是 M 在 w 上 的 起 始 格 局 。 

2. 每 个 Ci+1 都 是 CG 的 合法 结果 。 

3. C 是 M 的 一 个 接受 格局 。 

M 在 w 上 的 起 始 格 局 Cl 应 该 是 串 qww w, HH gq 是 MM 在 w 上 的 起 始 状 态 。 
XS AE ARTE B 中 的 ， 所 以 B 能 够 检查 第 一 个 条 件 。 接 受 格 局 是 包含 状态 q,..w 的 格 
局 ， 所 以 B 只 要 通过 扫描 Ci 看 能 否 找 到 gq,..。,,， 就 可 检查 第 三 个 条 件 。 第 二 个 条 件 的 检查 
是 最 困难 的 ， 对 每 对 相 邻 的 格局 ，B 要 检查 Cri 是 否 为 Ci 的 合法 结果 。 这 个 步骤 包括 : 
除了 Ci 中 读 写 头 下 的 位 置 及 其 相 邻 位 置 外 ， 验 证 C; 和 Ci+1 是 相同 的 ， 而 上 述 几 个 位 置 
必须 根据 转移 函数 来 更 新 。B 通过 在 C; 和 Ci+l 的 相应 位 置 间 来 回 移 动 ， 验 证 更 新 是 否 适 
当 。 为 了 在 来 回 移 动 时 记录 当前 位 置 ，B 用 点 在 带子 上 标记 当前 位 置 。 最 后 ， 如 果 条 件 1、 
2 和 3 ABA, WM B 接受 输入 。 

将 判定 器 的 答案 反 过 来 ， 就 能 得 到 M 是 否 接 受 w 的 答案 。 这 样 就 判定 了 Atm， 这 是 
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AS FPG 

证 明 现在 构造 从 Armë Ersa 的 归 约 。 假 设 图 灵机 R 判定 Erpa。 如 下 构造 判定 Am 
的 图 灵机 S: 

S 一 “对 于 输入 (Mow), BPM 是 图 灵机 ，w 是 串 : 

1. 如 在 证 明 思 路 中 所 描述 的 那样 从 M Al w 构造 LBA B. 
2. TERA (BD) 上 运行 R。 
3. WF R 拒绝 ， 则 接受 ; 如 果 R 接受 ， 则 拒绝 。” 

如 果 尺 接受 “B)， 则 L(B)= 二 多。 这 样 ，M 在 w 上 就 没有 接受 计算 历史 ，M 也 就 不 
接受 w。 因 此 ，S 就 拒绝 (M, w). KWH, 
如 果 尺 拒绝 (B), M B 的 语言 不 空 。B 能够 
SMM BE M 在 w 上 的 接受 计算 历史 。 
这 样 ，M 必定 接受 w。 相 应 地 ，S 也 就 接受 
《M,w)。 图 5- 3 是 检查 这 样 一 个 图 灵机 计算 
历史 的 示意 图 。 | m 

使 用 计算 历史 的 归 约 技术 ; 还 能 建立 有 美国 全 3 葵 村 一 个 图 风机 时 站 历史 的 LBA B 
上 下 文 无 关 文法 和 下 推 自动 机 问题 的 不 可 判定 性 。 回 忆 一 下 ， 定 理 4.7 介绍 了 一 个 算法 来 
判定 一 个 上 下 文 无 关 文 法 是 否 派 生 串 ， 即 判定 L(G) 二 名 是 否 成 立 。 与 此 相关 ， 现 在 要 证 
明 问 题 “ 测 定 一 个 上 下 文 无 关 文 法 是 否 派 生 所 有 可 能 的 串 ” 是 不 可 判定 的 。 证 明 这 个 问题 
不 可 判定 是 证 明 上 下 文 无 关 文法 等 价 性 问题 不 可 判定 的 重要 步 又。 设 

Alle =100 |G 2=4 GPG H LGI =") 

ALLcrG 是 不 可 判定 的 。 

证 明 用 反 证 法 。 为 得 到 矛盾 ， 假 设 ALLcre 是 可 判定 的 ， 用 这 个 假设 来 证 明 ATm 是 
可 判定 的 。 其 证 明 与 定理 5. 9 的 证 明 类 似 ， 只 是 稍微 复杂 一 些 ， 绕 了 一 点 点 弯 。 这 是 一 
从 Ar 出 发 利用 计算 历史 的 归 约 。 但 由 于 技术 上 的 原因 ， 对 计算 历史 的 表示 做 了 些 修 改 ， 
后 面 将 解释 这 样 做 的 原因 。 

现在 来 描述 怎样 运用 ALLcrec 的 判定 过 程 来 判定 ArM 。 对 于 图 灵机 M ARBAB w, A 
先 构 造 一 个 CFG G， 使 得 它 派 生 所 有 串 当 且 仅 当 MARS w., MU, MRM w, Ill 
存在 一 个 特别 的 串 ，CG 不 派生 它 。 这 个 串 应 该 是 一 一 猿 猿 看 一 一 M 在 w 上 的 接受 计算 历 
史 。 即 设计 G， 使 之 派生 所 有 不 是 M Ew 上 接受 计算 历史 的 串 。 

为 了 使 得 CFG G 派生 所 有 不 是 M 在 w 上 接受 计算 历史 的 串 ， 采 用 下 面 的 策略 。 一 个 串 不 
能 成 为 接受 计算 历史 的 原因 可 能 有 多 个 。 将 M 在 we LITER BRAM HOH 
CGH, RHC 是 M 在 w 上 计算 的 第 i 步 的 格局 。 然 后 G 派 生出 满足 下 述 条 件 的 所 有 串 : 

1. 不 以 C1 开始 。 

2. 不 以 一 个 接受 格局 结束 。 

3. Æ M 的 规则 下 ， 某 个 C; 不 恰好 派生 Cio 

如 果 M 不 接受 凤 ， 就 没有 接受 计算 历史 存在 ， 故 所 有 串 都 因 这 样 或 那样 的 问题 而 不 
能 成 为 接受 计算 历史 ， 因 此 G 将 派生 所 有 串 ， 这 正 是 所 希望 的 。 

现在 来 认真 考虑 G 的 实际 构造 。 不 是 真 的 构造 G， 而 是 构造 一 个 PDA D， 因 为 可 以 
使 用 定理 2. 12 中 的 构造 将 D 转换 为 一 个 CFG。 这 样 做 是 因为 ， 就 我 们 的 目的 而 言 ， 设 计 
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— PDA 要 比 设计 一 个 CFG 容易 。D 以 非 确定 的 分 支 计算 开始 ， 猜 测 前 面 的 三 个 条 件 中 
哪 一 个 被 拿 来 检查 。 它 以 一 个 分 支 检查 输入 串 的 开始 部 分 是 否 为 C1， 如 果 不 是 ， 则 接受 。 
以 为 一 个 分 支 检查 输入 串 是 否 以 一 个 包含 接受 状态 q,.. 的 格局 结束 ， 如 果 不 是 ， 则 接受 。 

第 三 个 分 支 的 作用 是 : 如 果 某 个 Ci 不 恰好 派生 Ci;+1， 就 接受 。 其 工作 方式 如 下 : 首 
先 扫 描 输入 ， 直 到 它 非 确 定性 地 确定 它 已 到 达 C;。 第 二 步 ， 它 将 C; 推进 栈 里 ， 直 至 由 符 
号 # 标 记 的 结尾 。 第 三 步 ,，D 弹出 栈 与 Ci+1 比 较 。 除 了 读 写 头 附近 位 置 外 ， 它 们 应 该 相 
同 。 读 写 头 附近 位 置 的 更 改 应 由 M 的 转移 函数 决定 。 最 后 ， 如 果 发 现 不 匹配 或 不 适当 的 
更 改 ，D 就 接受 。 

这 个 思路 存在 的 问题 是 : 当 D 将 C; 弹出 栈 时 ， 它 处 于 相反 的 顺序 ， 因 而 不 适合 与 
Ci+1 比 较 。 前 面 提 到 的 绕 弯 就 在 此 处 。 换 一 种 方法 来 写 接受 计算 历史 ， 使 得 每 隔 一 个 格局 
就 以 相反 的 顺序 出 现 。 奇 数位 置 保持 向 前 的 顺序 写 ， 但 偶数 位 置 向 后 写 。 这 样 形 式 的 一 个 
接受 计算 历史 如 图 5-4 所 示 。 


x 一 > ,# Eoo a O e # # 
C'i cy C3 cr Ci 


图 5-4 Eia — “SJ aot DA AA Be H E 


知 PDADD 以 此 修改 后 的 方式 将 格局 推进 栈 ， 则 当 它 们 再 弹出 时 ， 其 顺序 就 适合 与 
下 一 个 格局 进行 比较 了 。D 的 设计 就 是 要 使 得 接受 那些 不 是 接受 计算 历史 的 任何 修改 后 
的 串 。 a 
在 练习 5.1 中 ， 可 以 使 用 定理 5. 10 来 证 明 EQcrc 是 不 可 判定 的 。 


5.2 一 个 简单 的 不 可 判定 问题 

本 节 将 证 明 : 不 可 判定 性 现象 不 仅仅 局 限于 自动 机 的 问题 。 我 们 将 给 出 一 个 关于 串 操 
作 的 不 可 判定 问题 ， 称 为 波斯 特 对 应 问题 (Post Correspondence Problem, PCP). 

可 以 很 容易 地 将 这 个 问题 描述 成 一 种 游戏 一 一 多 米 诺 骨牌 。 每 个 骨牌 由 两 个 串 构 成 ， 
=W ETRA LER 


— Te A MARRIR 
b a ca abc 
| (Leal Lab} [2+ EN 
任务 是 将 这 些 骨牌 进行 排列 〈 人 允许 重复 ) ， 使 得 在 阅读 顶部 符号 后 得 到 的 串 与 阅读 底 
部 符号 后 得 到 的 串 相 同 。 这 样 的 排列 称 为 一 个 匹配 (match)。 例 如 ， 下面 的 排列 就 是 这 个 


游戏 的 一 个 匹配 。 
a b "rear a rabc 
PIR | | 
阅读 项 部 后 得 到 串 abcaaabe, 与 阅读 底部 后 得 到 的 相同 。 可 以 将 骨牌 变形 ， 使 得 顶部 和 底 
部 对 应 符号 整齐 地 排列 ， 以 便 更 容易 表示 匹配 。 
是 a 
í Me ss 


la bie alaia ble! 


(aia b cj 
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对 某 些 骨牌 徐 ,不 可 能 找到 这 样 的 匹配 。 例 如 ， 簇 
abc ca acc 
jot 
不 可 能 包含 匹配 ， 因 为 项 部 的 每 个 串 都 比 底部 对 应 的 串 长 。 
波斯 特 对 应 问题 是 : 确定 一 簇 骨 有 牌 是 否 有 一 个 匹配 。 这 个 问题 在 算法 上 是 不 可 解 的 。 


在 形式 描述 这 个 定理 和 给 出 它 的 证 明之 前 ， 先 来 精确 地 描述 这 个 问题 ， 然 后 表示 成 一 
个 语言 。 骨 牌 复 P Æ PCP 的 一 个 实例 : 


| 
匹配 是 一 个 序列 ,is，… ,it， 使 得 ti ti, etti, 二 bi bi tbi 。 问 题 是 确定 P 是 否 有 匹配 。 令 
PCP={(P)| P 是 波斯 特 对 应 问题 的 一 个 实例 , 且 PALER) 

PCP 是 不 可 判定 的 。 

证 明 思 路 ”虽然 证 明 有 许多 技术 上 的 细节 ， 但 概念 还 是 简单 的 ， 主 要 技术 是 由 AT™ 出 
发 利用 接受 计算 历史 的 归 约 。 证明: 从 任意 的 图 灵机 M 和 输入 w 都 能 构造 一 个 实例 已 ， 
使 得 匹配 都 是 M Ew 上 的 接受 计算 历史 。 这 样 ， 如 果 能 确定 这 个 实例 是 否 有 一 个 匹配 ， 
就 能 确定 M 是 否 接 受 w 

但 是 怎么 构造 P 使 得 匹配 都 是 M Ew 上 的 接受 计算 历史 呢 ? 在 已 中 选择 骨牌 ， 使 得 
每 形成 一 个 匹配 ， 便 模拟 一 次 M。 且 在 匹配 中 ， 每 个 骨牌 都 将 一 个 格局 中 的 一 个 或 多 个 位 
置 与 下 一 个 格局 中 的 相应 位 置 连 接 起 来 。 

在 构造 之 前 ， 先 处 理 三 个 小 的 技术 要 点 。( 在 第 一 次 通读 时 ， 不 要 过 于 担心 这 些 。) 第 
—, ATHE P 的 构造 ， 假 设 M 在 w 上 从 不 试图 将 它 的 读 写 头 移出 带子 的 左 端点 。 这 要 
求 首先 改变 M 以 防止 这 样 的 行为 。 第 二 ， 如 果 wre, MEHE PHA BUR w B=, 
修改 PCP， 要 求 匹 配 都 从 第 一 个 骨牌 开始 ， 即 : 


ti 
a. 
稍 后 将 说 明 怎 么 去 掉 这 个 要 求 。 我 们 称 这 个 问题 为 修改 了 的 波斯 特 对 应 问题 (MPCP) 。 设 
MPCP={(P)|P 是 波斯 特 对 应 问题 的 一 个 实例 ,P 有 一 个 从 第 一 个 骨牌 开始 的 匹配 } 
现在 进入 证 明细 节 ， 即 设计 P 来 模拟 M Ew 上 的 动作 。 
WEAR 假设 图 灵机 R 判定 PCP。 构 造 SHH AM. $ 
M= (Q, 2, Ið» do ,qaccept ?Ireject ) 
其 中 Q，5, ,6 分 别 是 MM 的 状态 集 、 输 入 字母 表 、 带 子 字母 表 和 转移 函数 。 
S 构造 PCP 的 一 个 实例 已， 使 得 P 有 一 个 匹配 当 且 仅 当 M 接受 ww。 为 此 ，S 首先 构 
造 MPCP 的 一 个 实例 P 。 下 面 以 七 个 部 分 来 描述 这 个 构造 ， 每 个 部 分 完成 在 w 上 模拟 
M 的 一 个 特定 方面 。 在 构造 过 程 中 ,为 了 解释 我 们 正在 做 什么 ， 用 一 个 例子 插 在 构 
造 中 。 
第 1 部 分 : 构造 以 下 列 方式 开始 : 


因为 P 是 MPCP 的 一 个 实例 ， 故 匹配 必须 以 这 张 骨牌 开始 。 底 部 串 以 M 在 w Ei 
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受 计 算 历 史 中 的 第 一 个 格局 Ci =q wi ween 开始 ， 如 图 5-5 所 示 。 
到 目前 为 止 ， 只 得 到 一 个 部 分 匹配 ， EJER E H H gq, wi w 4 
wn 2H, RRRA A. REIN, BA RTE 
来 匹配 底部 申 。 用 新 骨牌 来 做 这 样 的 扩展 。 这 些 新 的 骨牌 强迫 d, O 
模拟 M 的 一 次 单 步 运行 ， 使 得 M ORF a ee oO 
的 扩展 中 。 
第 2、3 和 4 部 分 在 已 中 增加 的 骨牌 在 模拟 中 起 主要 作用 。 第 2 部 分 处 理 读 写 头 向 右 
运动 ， 第 3 部 分 处 理 读 写 头 向 左 运 动 ， 第 4 部 分 处 理 不 与 读 写 头 相 邻 的 带子 方 格 。 
第 2 部 分 : 对 于 每 一 个 a» bET Allg; reQ, 其 中 vn OT 
如 果 ad= rb R MAT E | 放 入 了" 中 
第 3 部 分 : 对 于 每 一 个 a， b, cer tl as rE Q, 其 中 人 
如 果 ga) = Crb L) El SE | 放 入 pP} 


第 4 部分， 对 于 每 一 个 ET,， 将 | 和 kA P. 


现 补充 一 个 虚拟 的 例子 来 说 明 到 目前 为 止 我 们 已 经 构造 了 些 什么 。 设 有 = 人 0,1,2,U)。 
假设 w 是 串 0100，M 的 起 始 状 态 是 gq。。 在 状态 gq, 且 读 0 时 ， 假 设 转移 函数 指示 M 进入 
状态 q; ， 在 种子 上 写 下 2， 并 将 它 的 读 写 头 向 右 移动 。 即 ，6(g。 ,0) 二 (gq; ,2,R)。 

第 1 部 分 将 如 下 骨牌 放 人 P 中 : 


ETT a] 


a 
#010 0 # 


另外 ， 因 为 5(g, ,0) 二 (gq, ,2,R)， 第 2 部 分 放置 如 下 骨牌 : 
bad 
因为 0，1，2，U 是 也 的 成 员 ， 故 第 4 部 分 将 下 列 骨 牌 放 人 P P: 
wt Eea 


这 一 步 与 第 5 部 分 一 起 使 得 匹配 得 到 如 下 扩展 : 


且 匹 配 以 如 下 方式 开始 : 








这 样 ， 第 2、3 和 4 部 分 的 骨牌 使 得 我 们 能 够 通过 “在 第 一 个 格局 之 后 增加 第 二 个 格 
局 ”的 方法 来 扩展 匹配 。 布 望 这 个 过 程 能 够 继续 下 去 ， 即 增加 第 三 个 格局 ， 然 后 第 四 个 格 
局 ， 等 等 。 为 此 ， 需 要 增加 一 个 新 的 骨牌 来 复制 符号 # 。 
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第 5 部 分 : 
y Ela l / 
将 | || Ge [RAP P 
XA ae PA MERTERT +. CEN MERE. BARRER 
们 能 在 格局 的 末端 增加 一 个 空白 符 U， 以 此 来 模拟 右边 的 无 限 多 个 空格 ， 这 些 空格 在 写 格 
局 时 被 压缩 了 。 
接着 上 面 的 例子 ， 假 设 在 状态 9; 且 读 1 时 ，M 进入 状态 gq;， 在 带子 上 写 下 0， 并 将 读 
写 头 向 右 移动 ， 即 8(qy ,1) 二 (qs ,0,R)。 则 在 已 中 有 骨牌 
gdl 
A 


最 后 的 那个 匹配 被 扩展 到 





TETEE roa STIT 


再 假设 在 状态 g; 且 读 0 时 ，M 进入 状态 gq,， 在 带子 上 写 下 2， 并 将 它 的 读 写 头 向 左 
移动 。 故 6(g; JE Cag Asla a 则 有 骨牌 


l Bo | 
q,021’ Le lJ Lq, 22 qa U2 


第 一 个 骨牌 与 本 构造 有 关 ， 因 为 读 写 头 左边 的 符号 是 0。 前面 的 部 分 匹配 就 被 扩展 成 

















48 me o erT 


ER, PDA w 上 模拟 M， 这 个 过 程 要 一 直 进 行 到 M 到 达 停 机 状态 。 如 果 
出 现 了 接受 状态 ， 则 希望 这 个 部 分 匹配 的 顶部 “ 赶 上 ”底部 ， 从 而 使 得 这 个 匹配 得 以 完 
成 。 为 此 ， 再 增加 如 下 骨牌 。 

第 6 部 分 : 对 于 每 一 个 ae’, 

将 | Passes | 和 | accen $ accept | 放 入 书 中 


Gaccept q accept 


这 个 步骤 的 效果 是 : 在 图 灵机 停机 后 增加 一 些 “ 伪 步骤 ”。 这 里 ， 读 写 头 “ 吃 掉 ” 一 
些 邻 近 的 符号 直到 没有 符号 剩 下 。 再 继续 前 面 的 例子 ， 假 设 到 机 需 以 接受 状态 停机 的 地 方 


为 止 的 部 分 匹配 是 
a 
Dna 


刚才 增加 的 骨牌 允许 匹配 如 下 继续 进行 : 
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cee ia : “Ss SS SS 
# 2 1 accept ss 2 # 2 $ | Gaccept | 2 | # N 


第 7 部 分 : 最 后 增加 如 下 骨牌 
daccept + H 
in 


# accept # z 

这 就 结束 了 整个 P' 的 构造 。 注 意 P Æ MPCP 的 一 个 实例 ， 而 正 是 凭借 MPCP， 匹 配 
才 模 拟 了 M 在 w 上 的 计算 。 为 完成 证 明 ， 回 忆 一 下 ，MPCP 与 PCP 的 不 同 之 处 在 于 : 匹 
配 需要 以 序列 中 的 第 一 个 骨牌 开始 。 如 果 将 P AE PCP 的 一 个 实例 ， 而 不 是 看 作 MPCP 
的 一 个 实例 ， 则 无 论 M 是 否 接 受 w， 显 然 它 都 有 一 个 匹配 。 你 能 发 现 它 吗 ? (提示 : 它 非 
常 短 。) 

现在 说 明 怎 么 将 P' 转 化 为 PCP 的 实例 已 ， 使 之 仍然 模拟 M Ew 上 的 运行 。 这 时 用 了 
一 点 技术 上 的 窗 门 。 思 路 是 : 以 “第 一 个 骨牌 开始 ”为 要 求 ， 并 且 将 这 个 要 求 直 接 放 人 问 
题 ， 使 其 目 动 成 为 强制 性 的 。 这 样 ， 就 不 需要 明确 地 提出 这 个 要 求 。 为 此 引入 一 些 记 号 。 

设 u=uju2"un 是 一 个 长 度 为 n WE, Ek, ukMkuk EM FETE: 


来 完成 匹配 : 





Kku= * uy * uz * Us * 8 * Uy 
u= u, * üz Ua * =e ¥ u, * 
Kkuk= * Ul * uz * Us * ° * Un * 


XE, ku 是 在 x 中 的 每 个 字母 前 增加 符号 * ， uk EE u 中 的 每 个 字母 后 增加 符号 
Kk, kuk EE 中 每 个 字母 的 前 和 后 都 增加 符号 * 。 为 将 P' 转 换 为 PCP 的 一 个 实例 P, 
做 下 面 的 事情 : 如 果 P' 是 如 下 的 簇 : 

tk 
il 


lach Lee + Lee 
BS P 是 如 下 的 簇 ; 


[za [ise ) Lasse] > [ise] Pe N 
Ue a ARE PAWE PCP 的 实例 ， 就 可 以 看 到 ， 可 能 形成 匹配 的 唯一 的 骨牌 是 第 一 个 骨牌 
[RE] 
因为 它 是 项 部 和 底部 以 相同 符号 〈 即 * ) 开始 的 唯一 的 骨牌 。 除 了 强迫 以 第 一 个 骨牌 开始 


匹配 以 外 ，* 的 使 用 并 不 影响 可 能 的 匹配 ， 因 为 它们 被 原来 的 符号 相互 隔 开 ， 原 来 的 符号 
现在 出 现在 匹配 的 偶数 位 。 骨 牌 

















k 


是 用 来 让 顶部 在 匹配 的 最 后 再 增加 一 个 x 。 = 
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5.3 了 映射 可 归 约 性 


前 面 已 经 说 明了 ， 使 用 可 归 约 性 技术 可 以 证 明 各 种 问题 的 不 可 判定 性 。 本 节 将 可 归 约 
性 这 个 概念 形式 化 ， 这 样 就 能 更 精确 地 使 用 它 ， 人 例如， 证明 某 些 语言 不 是 图 灵 可 识别 的 ， 
此 外 还 可 应 用 于 复杂 性 理论 中 。 

将 一 个 问题 归 约 为 另 一 个 问题 的 概念 可 以 用 多 种 方式 来 形式 定义 ， 选 择 使 用 哪 种 
方式 要 根据 具体 应 用 情况 。 我 们 的 选择 是 一 种 简单 方式 的 可 归 约 性 ， 叫 作 映 射 可 归 约 
{O (mapping reducibility) 。 

粗略 地 说 ,“ 用 映射 可 归 约 性 将 问题 A 归 约 为 问题 B” 指 的 是 ， 存 在 一 个 可 计算 函数 ， 
它 将 问题 A 的 实例 转换 成 问题 B 的 实例 。 如 果 有 了 这 样 一 个 转换 函数 〈 称 为 归 约 )， 就 能 用 
B 的 解决 方案 来 解 A。 原 因 是 ，A 的 任何 一 个 实例 可 以 这 样 来 解 : 首先 用 这 个 归 约 将 A 转换 
为 B 的 一 个 实例 ， 然 后 应 用 B 的 解决 方案 。 映 射 可 归 约 性 的 一 个 精确 定义 在 下 文中 介绍 。 


5.3.1 可 计算 函数 


图 灵机 计算 函数 的 方式 是 : 将 函数 的 输入 放 在 带子 上 ， 开 始 运 行 ， 并 以 停机 后 的 带子 
作为 函数 的 输出 。 

STED 24 f:d*>>* 是 一 个 可 计算 函数 (computable function)， 如 果 有 某 个 
图 灵机 M， 使 得 在 每 个 输入 w EM 停机 ， 且 此 时 只 有 f) 出 现在 带子 上 。 

”整数 上 所 有 通常 的 算术 运算 都 是 可 计算 函数 。 例 如 ， 可 以 制造 一 个 机 器 ， 它 
以 《m，n〉 为 输入 且 返 回 m 与 n 的 和 mm 十 nxn。 在 这 里 不 给 出 细节 ， 而 把 它们 当 作 练习 。 s 

games i AKAT EHAR E, an, MRw=(M) 是 图 灵机 
M 的 编码 ， 则 可 以 有 一 个 可 计算 函数 f， 以 ww 为 输入 ,上 且 返 回 一 个 图 灵机 的 描述 〈M )。 
M 是 一 个 与 M 识别 相同 语言 的 机 器 , 但 M 从 不 试图 将 它 的 读 写 头 移出 它 的 带子 的 左 端 
Kio PRAM f 通过 在 M 的 描述 中 加 入 一 些 状态 来 完成 这 个 任务 。 如 果 w 不 是 图 灵机 的 合法 
编码 ，f PIR Fle. z 
5.3.2 映射 可 归 约 性 的 形式 化 定义 

现在 定义 映射 可 归 约 性 。 同 以 往 一 样 ， 以 语言 来 表示 计算 问题 。 

STED 语言 A 是 映射 可 归 约 到 语言 B 的 ， 如 果 存 在 可 计算 函数 f:5* > 使 
得 对 每 个 w, 

wEAS f(wEB 

AX, B。 称 函数 f AKA 到 B 的 归 约 。 

图 5- 6 说 明了 映射 可 归 约 性 。 

A 到 B 的 映射 归 约 提供 了 将 A 的 成 员 测 试问 题 转化 为 
B 的 成 员 测 试问 题 的 方法 。 为 了 检查 是 否 有 wEeA, Al fii 
用 这 个 归 约 了 将 了 世上 映射 到 f(w)， 然 后 检查 是 否 wEB. 
术语 映射 归 约 来 自 于 提供 归 约 手段 的 函数 或 映射 。 图 5-6 将 A 归 约 到 B 的 函数 了 





CO 有 些 教科 书 称 之 为 多 一 可 归 约 性 (many-one reducibility) 。 
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如 果 一 个 问题 映射 可 归 约 到 第 二 个 问题 ， 且 第 二 个 问题 先前 已 被 解决 ， 那 就 能 得 到 原 
来 问题 的 解 。 定 理 5. 16 说 明 这 个 思路 。 
如 果 A 二 mB 且 B 是 可 判定 的 ， 则 A 也 是 可 判定 的 。 
证 明 设 M 是 B 的 判定 器 ，f 是 从 A 到 B 的 归 约 。A 的 判定 器 NN 的 描述 如 下 : 
N= 二 “对 于 输入 w: 
1. 计算 fw). 
2. Æ fw) 上 运行 M， 输 出 M 的 输出 。” 
RA, MRwEA, M fl(w)EB， 因 为 是 从 A 到 B 的 归 约 。 因 此 ， 只 要 wEA， 则 
M ÈZ fw). W N 的 运行 正如 所 求 。 a 
定理 5.16 的 下 列 推论 是 证 明 不 可 判定 性 的 主要 工具 。 
如 果 A 二 mB 且 A 是 不 可 判定 的 ， 则 召 也 是 不 可 判定 的 。 
前 面 的 一 些 证 明 使 用 了 可 归 约 性 方法 。 回 顾 这 些 证 明 就 可 得 到 映射 可 归 约 性 的 一 些 
例子 。 
定理 5. 1 使 用 从 Arw 出 发 的 一 个 归 约 ， 证 明了 HALT MEAT AEM. 
这 个 归 约 说 明了 如 何 用 HALT om 的 判定 器 给 出 Arm 的 判定 器 。 以 下 展示 从 Arm 到 
HALTrM 的 映射 可 归 约 性 ， 为 此 必须 提供 一 个 可 计算 函数 f， 它 使 用 形 如 〈“M,w〉 的 输 
和信， 返回 形 如 〈M  ,w 》 的 输出 ， 使 得 
(M, w) E Arm %4 ER 4M w) E HALTr™ 
FEARI FiA THA f: 
上 上 一 “对 于 输入 (M, w): 
1. 构造 下 列 图 灵机 M 。 
M 一 “对 于 输入 x: 
a. Æ x 上 运行 M。 
b. WR M 接受 ， 则 接受 。 
c. WR M 拒绝 ， 则 进入 循环 。? 
2. 输出 M w.” 
对 于 形式 不 正确 的 输入 串 在 此 还 有 一 些小 问题 ， 就 是 如 果 图 灵机 下 确定 某 输 入 对 于 输 
入 行 的 描述 “对 于 输入 〈‘M,w):” 来 说 形式 不 正确 ， 因 而 此 输入 不 在 Amt, WAAT 
图 灵机 输出 的 串 也 不 在 有 HALTrm 中 。 可 是 所 有 不 在 HALTrv 中 的 串 都 将 被 处 理 。 应 当 指 
出 ， 通 常 而 言 ， 当 我 们 描述 一 个 图 灵机 进行 A 到 B 的 归 约 时 ， 都 假定 形式 不 正确 的 输入 
串 已 经 被 映射 到 B 之 外 了 。 s 
URAR 定理 5.11 中 的 波斯 特 对 应 问题 是 不 可 判定 的 ， 其 证 明 中 包含 了 两 个 映射 
归 约 。 它 首先 证 明了 Atw<m MPCP， 然 后 又 证 明了 MPCP<,, PCP。 对 这 两 种 情形 ， 都 
能 容易 地 得 到 实际 的 归 约 函数 ， 且 能 容易 地 证 明 它 们 是 映射 归 约 。 如 练习 5.6 Pm, RA 





可 归 约 性 是 传递 的 ， 故 这 两 个 归 约 合 起 来 蕴涵 Armm PCP. z 
在 定理 5. 4 的 证 明 中 ， 隐 含 了 一 个 从 Erm 到 EQm PRAIA. WIAA f 
HAA (M) 映射 到 输出 〈《M,Mi )， 其 中 Mi 是 拒绝 所 有 输入 的 机 器 。 


2 和 ”本 节 定 义 了 映射 可 归 约 性 的 形式 概念 ， 本 章 的 前 面部 分 所 使 用 的 可 归 约 性 
都 是 非 形式 概念 。 定 理 5. 2 证 明 Erm 是 不 可 判定 的 ， 这 个 证 明说 明了 映射 可 归 约 性 的 形式 
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概念 与 可 归 约 性 的 非 形式 概念 之 间 的 差别 。Erm 的 不 可 判定 性 是 通过 将 Arm 归 约 到 它 来 证 
明 的 。 现 在 来 看 看 能 否 将 这 个 归 约 转换 为 映射 归 约 。 

根据 原来 的 归 约 可 以 很 容易 地 构造 图 数 f EA M, w) WWA, FEM (M), 
其 中 Mi 就 是 在 那个 证 明 中 描述 的 图 灵机 。 但 M 接受 w 当 且 仅 当 工 (Mi) 不 空 ， 故 f 是 从 
ATtm 到 Erm 的 映射 归 约 。 它 还 证 明了 Erm 是 不 可 判定 的 ， 因 为 可 判定 性 不 受 求 补 的 影响 。 
但 它 没有 给 出 从 Amal Erm 的 映射 归 约 。 事实 上 ， 没 有 这 样 的 归 约 存在 。 练 习 5. 5 要 求证 
明 这 个 结论 。 

映射 可 归 约 性 对 求 补 运算 是 敏感 的 ， 这 对 用 可 归 约 性 来 证 明 某 些 语言 的 不 可 识别 性 
非常 重要 。 也 可 以 使 用 映射 可 归 约 性 来 证 明 某 些 问 题 不 是 图 灵 可 识别 的 。 下 列 定理 与 定 
理 5. 16 十 分 相似 。 

如 果 ALn B， 且 B 是 图 灵 可 识别 的 ， 则 A 也 是 图 灵 可 识别 的 。 

此 定理 的 证 明 与 定理 5. 16 的 证 明 类 似 ， 只 是 将 M 和 N 改 为 识别 器 而 非 判定 器 。 

如 果 ALn B， 且 A 不 是 图 灵 可 识别 的 ， 则 B 也 不 是 图 灵 可 识别 的 。 

作为 这 个 推论 的 一 个 典型 应 用 , BEA 是 Arw 的 补 集 Arw 。 由 推论 4. 17 知 ，Arw 不 是 
图 灵 可 识别 的 。 由 映射 可 归 约 性 的 定义 不 难看 出 : ALm B 与 A 三 mB 有 相同 的 含义 : 为 证 
明 B 不 是 可 识别 的 ， 可 以 证 明 Armm B。 还 可 以 使 用 映射 可 归 约 性 来 证 明 某 些 问 题 既 不 
是 图 灵 可 识别 的 ， 也 不 是 补 图 灵 可 识别 的 ， 就 像 下 面 的 定理 那样 。 

FEQTrM 既 不 是 图 灵 可 识别 的 ， 也 不 是 补 图 灵 可 识别 的 。 

证 明 首先 证 明 EQrw 不 是 图 灵 可 识别 的 。 为 此 ， 只 要 证 明 Arm 可 归 约 到 EQrm 即 可 。 
JRA pk 上 如 下 : 

FF 一 “对 于 输入 (Mow), HP M 是 图 灵机 ，w ES: 

1. 构造 下 列 两 个 机 器 Mi 和 M2. 
Mi = 二 “对 于 任何 输入 : 
a. 42%,” 
M: 二 “对 于 任何 输入 : 
a 在 w 上 运行 M， 如 果 它 接受 ， 就 接受 。? 
2. E (Mi, M2).” 

XE, M 什么 也 不 接受 。 如 果 M 接受 w， 则 M2 接受 每 一 个 输入 ， 故 两 个 机 器 不 等 
价 。 相 反 ， 如 果 M 不 接受 凤 ， 则 Ms 什么 也 不 接受 ， 故 它们 是 等 价 的 。 这 样 f 将 Arw 归 
约 到 EQrw ， 这 正 是 我 们 所 希望 的 。 

为 了 证 明 EQrw 不 是 图 灵 可 识别 的 ， 只 要 给 出 一 个 从 Arm EEQ hih CAD EQrm) 
的 归 约 。 因 此 要 证 明 Arm<m EQrv。 下 面 的 图 灵机 G 计算 归 约 函数 g 。 

G 一 “对 于 输入 (Mw), HP M 是 图 灵机 ，w 是 串 : 

1. 构造 下 列 两 个 机 器 ，Mi 和 M. 
Mi 一 “对 于 任何 输入 : 
a. HEE.’ 
M: 二 “对 于 任何 输入 : 
a. 在 也 上 运行 M。 
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b. 如 有 果 它 接受 ， 就 接受 。 
2. 输出 (Mi, M2).” 


fA g 之 间 的 唯一 差别 在 机 器 Mi E. EP, Plat Mi 总 是 拒绝 ， 而 在 5 中， 它 总 


是 接受 。 在 和 g 中 ，M 接受 w 当 且 仅 当 Ms 接受 所 有 串 。 在 g 中 ，M 接受 w 当 且 仅 当 
M, 和 M: 等 价 。 这 就 是 g 是 从 Ar 到 下 Qrv 的 归 约 的 原因 。 = 


练习 


5.1 
5.2 
- 


n oy 
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证 明 下 Qcrc 是 不 可 判定 的 。 
证 明 EQcrc 是 补 图 灵 可 识别 的 。 
请 找 出 下 面 波斯 特 对 应 问题 (PCP) 实例 中 的 一 个 匹配 : 


esr Led LS] LSJ} 
mRA<.BABE—-T+EWAA,. KEAAMA A 也 是 一 个 正则 语言 ? 为 什么 ? 
证 明 Arw 无 法 映射 归 约 到 Er 。 换 句 话说 ， 也 就 是 证 明 没 有 可 计算 函数 可 以 将 Arw 归 约 为 Em. 
(提示 : 用 ArmA Erm 的 一 些 已 知 的 矛盾 和 事实 来 证 明 。) 
证 明和 是 一 个 传递 关系 。 
证 明 : WR A 是 图 灵 可 识别 的 ， 且 Am A， 则 A 是 可 判定 的 。 
在 定理 5. 11 的 证 明 中 ， 修改 了 图 灵机 M， 使 得 它 永 不 试图 将 其 读 写 头 移出 带子 的 左 端点 。 假 设 
如 果 不 做 这 样 的 修改 ， 将 不 得 不 对 PCP 做 怎样 的 修改 来 处 理 这 种 情形 ? 





it AMBIGcrc = { (G) |G 是 歧义 的 CFG}。 证 明 AMBIGcrc 是 不 可 判定 的 。 (提示: 使 用 来 自 PCP 


的 归 约 。 给 定 一 个 PCP 的 实例 
wd le 


用 下 列 规则 构造 一 个 CFG G: 


S+T|B 

Tt; Tay | | te Tag | trar |= | tag 

Bb, Bay | +++ | bp Bax | bia: | +++ | brar 
Hp a, e, ar 是 新 的 终结 符号 。 证 明 这 个 归 约 可 行 。) 


证 明 当 且 仅 当 A 二 nm Arm 时 ，A 是 图 灵 可 识别 的 。 

证 明 当 且 仅 当 A 二 mn Ox 1 * 时，A 是 可 判定 的 。 

设 J 一 {w | 对 于 某 个 -EArw 有 w 一 0z， 或 对 于 某 个 YE Arw 有 w=1ly}. TE J 和 J 都 不 是 图 灵 可 识别 
的 。 

给 出 一 个 不 可 判定 语言 B 的 例子 ， 使 得 Bn B. 

定义 二 头 有 穷 自 动机 (two-headed finite automaton, 2DFA) 为 确定 型 有 穷 自 动机 ， 它 有 两 个 双 回 
只 读 头 ， 只 读 头 部 从 输入 带 的 左 端点 开始 ， 可 以 独立 地 向 左 或 向 右 移动 。2DFA 的 带子 是 有 限 的 ， 
正好 包含 输入 和 两 个 额外 空白 带子 方 格 。 这 两 个 空白 带子 方 格 一 个 在 左 端点 ， 一 个 在 右 端点 ， 它 
们 被 用 作 定 界 符 。2DFA 通过 进入 一 个 特殊 的 接受 状态 来 接受 它 的 输入 。 例 如 ，2DFA 可 以 识别 
语言 {a"b"c” | n 之 0}。 

a. 设 Azra ={(M,2x)|M 是 个 2DFA HHS x}. WEH Azpra 是 可 判定 的 。 

b. 设 Esppa= {<M )|M 是 个 2DFA H L(M) =}. WH Ezpra 不 是 可 判定 的 。 

一 个 二 维 有 穷 自 动机 (two-dimensional finite automaton, 2DIM-DFA) 的 定义 如 下 : 输入 是 个 
mXn 和 矩形 (对 任意 m，n 宇 2)。 沿 着 矩形 边界 的 方 格 包含 符号 ， 而 内 部 方 格 包 含 输入 字母 表 中 


152 


nn 


a5, 


. 16 


17 


.18 


«19 


. 20 


. 25 
a5, 


26 
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WAS. RRM 6:QX (TUL #))—> QX {L,R,U,D} 用 来 指示 下 一 个 状态 和 读 写 头 的 新 位 置 
( 左 ， 右 ， 上 ， 下 )。 当 它 进入 事先 设 定 的 接受 状态 中 的 某 一 个 时 ， 机 器 就 接受 。 如 果 它 试图 移 
出 输入 矩形 或 永 不 停机 ， 它 就 拒绝 。 如 果 两 个 这 样 的 机 器 接受 相同 的 和 矩形， 那么 它们 是 等 价 
的 。 考 虑 检查 两 个 这 样 的 机 器 是 否 等 价 的 问题 。 将 这 个 问题 表达 成 语言 ， 并 证 明 它 是 不 可 判定 的 。 
赖 斯 定理 设 书 是 任何 图 灵机 的 语言 的 非 平 凡 属 性 。 证 明确 定 某 一 图 灵机 的 语言 是 否 具 有 属性 
忆 这 一 问题 是 不 可 判定 的 。 更 正式 地 说 ， 设 已 是 一 个 语言 ， 它 由 图 灵机 的 描述 组 成 ， 且 Pi 
足下 列 两 个 条 件 : 首先 ， 已 是 非 平 凡 的 一 一 它 包 含 某 些 图 灵机 的 描述 ， 但 不 是 所 有 的 ; 其 次 ， 
忆 是 图 灵机 的 语言 的 属性 一 一 无 论 何 时 工 (MI )=LCOM2: )， 当 且 仅 当 (M.)CPH, A (MDE 
P， 此 处 的 Mi 和 Ms* 是 任意 图 灵机 。 证 明 P 是 一 个 不 可 判定 语言 。 
证 明 在 问题 5. 16 中 的 两 个 条 件 对 于 证 明 P 的 不 可 判定 性 是 不 可 缺少 的 。 
使 用 问题 5. 16 中 的 赖 斯 定理 ， 证 明 下 列 语言 是 不 可 判定 的 : 
Aa. INFINITEm ={(M)|M 是 一 个 图 灵机 ， 且 LC(M) 是 一 个 无 限 语言 } 。 
b. {《M) |M 是 一 个 图 灵机 , 且 1011EL(M)}. 
c. ALL7m ={(M)|M 是 一 个 图 灵机 , 且 LOM) =" ) 。 
对 于 任意 自然 数 zx， 设 

3 区 十 1 cnr 

ZX/2 工 为 偶数 
如 果 从 整数 工 开始 ， 对 f 进行 迭代 ， 将 可 以 获得 如 下 序列 : c f), FC), =, KERI 
便 停止 。 例 如 ， 如 果 z= 二 17， 则 可 以 得 到 序列 17，52，26,13, 40, 20, 10, 5, 16, 8, 4, 
2，1。 大 量 的 计算 机 测试 显示 ， 在 1 到 一 个 正 整 数 的 区 间 内 任 选 一 点 作为 起 始点 ， 都 可 以 得 到 
一 个 以 1 为 结尾 的 序列 。 但 是 ， 是 否 以 任意 的 正 整数 为 起 始点 所 得 到 的 序列 都 能 以 1 为 结尾 还 
尚未 得 证 ， 此 问题 被 称 为 3z 十 1 问题 。 
假设 图 灵机 HAA Am, WA 互 来 描述 另 一 个 图 灵机 ， 该 图 灵机 能 够 满足 3z 十 1 问题 。 
证 明 下 列 两 种 语言 是 不 可 判定 的 : 
a. OVERLAP crc = (4G, H) |G lH 4H CFG, A LID NL(W+®D). (RF: 与 问题 5.9 的 
提示 相同 。) 
b. PREFIX-FREEcrc = {(G) |G 是 一 个 CFG,， 且 L(G) 是 前 缀 无 关 的 }。 
考虑 这 样 的 问题 : 确定 PDA 是 否 接受 某 些 形式 为 {ww|wE€E {0,1}* ) 的 串 ， 用 计算 历史 的 方 
法 证 明 该 问题 是 不 可 判定 的 。 
设 X=((M,w) |M 是 一 个 单 带 图 灵机 , 且 M 从 不 修改 带子 上 包含 输入 w 的 那 一 部 分 }。 请 问 X 
是 可 判定 的 吗 ? 证 明 你 的 结论 。 
对 CFG G 中 的 变 元 A ， 如 果 A 出 现在 某 字 符 串 wEG 的 所 有 派生 中 ， 则 称 A 是 必要 的 《neces- 
sary)。 设 NECESSARYcrc ={(G,A)|A 是 G 的 一 个 必要 变 元 }。 
a. 证 明 NECESSARYcrc 是 图 灵 可 识别 的 。 
b. 证 明 NECESSARYcrcG 是 不 可 判定 的 。 
对 一 个 CFG， 如 果 移 除 其 任何 一 个 规则 都 会 改变 其 产生 的 语言 ， 则 称 该 CFG 是 最 小 的 。 设 
MINcrc = { (G) |G 是 一 个 最 小 的 CFG}. 
a. WEAR MINcrG 是 图 灵 可 识别 的 。 
b. 证 明 MINcrc 是 不 可 判定 的 。 
设 T={ (M |M 是 一 个 图 灵机 ,每 当 M 接受 w 时 ,M 也 接受 wR }, 证 明代 是 不 可 判定 的 。 
考虑 这 样 的 问题 : 一 个 双 带 图 灵机 ， 当 它 在 输入 w 上 运行 时 ， 检 查 它 是 否 在 第 二 条 带子 上 写 下 
一 个 非 空白 符 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 
考虑 这 样 的 问题 : 一 个 双 带 图 灵机 ， 检 查 在 计算 任意 输入 串 的 过 程 中 它 是 否 在 第 二 条 带子 上 写 
下 一 个 非 空白 符 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 
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考虑 这 样 的 问题 : 一 个 单 带 图 灵机 ， 检 查 在 计算 任意 输入 串 的 过 程 中 它 是 否 在 非 空白 符 上 写 下 一 
VS AT 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 

图 灵机 的 一 个 无 用 状态 〈useless state) 是 对 任何 输入 它 都 不 会 进入 的 状态 。 考 虑 检查 一 个 图 灵机 
是 否 有 无 用 状态 的 问题 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 
考虑 这 样 的 问题 : 检查 图 灵机 在 输入 w 上 当 其 读 写 头 处 于 带子 最 左 方 格 时 ， 是 否 曾 经 试图 将 读 写 
头 向 左 移 。 将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 不 可 判定 的 。 

考虑 这 样 的 问题 : 检查 图 灵机 在 输入 记 上 是 否 曾 经 在 计算 过 程 的 某 个 地 方 试图 将 读 写 头 向 左 移 。 
将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 可 判定 的 。 

wZI=({0,1,U) 是 此 问题 中 所 有 图 灵机 的 带子 字母 表 。 下 面 是 勤劳 函数 (busy beaver function) 
BB:N>N HEX: 对 于 & 的 每 个 取 值 ， 考 虑 所 有 有 上 & 有 个 状态 的 图 灵机 ， 当 以 空白 带 为 开始 时 该 
图 灵机 停机 。 设 BBA) 是 这 些 图 灵机 的 带子 上 所 留 下 的 1 的 最 大 个 数 ， 证明 BB 是 不 可 计算 
PRX 

证 明 波 斯 特 对 应 问题 P P 在 一 元 字母 表 上 ( 即 在 字母 表 3 一 {1} 上 ) 是 可 判定 的 。 

证 明 波斯 特 对 应 问题 P CP) 在 二 元 字母 表 上 (〈 即 在 字母 表 23=(0,1》 H) 是 不 可 判定 的 。 

对 于 简易 波斯 特 对 应 问题 (silly Post Correspondence Problem，SPCP)， 在 每 个 对 中 ， 顶 部 的 串 与 
其 底部 的 串 长 度 相 同 ， 证 明 SPCP 是 可 判定 的 。 

证 明 存 在 (1)* 的 子 集 是 不 可 判定 的 。 


习题 选 解 
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5.6 


5.7 


5.8 


为 了 得 到 矛盾 ， 我 们 假定 通过 归 约 E Am<m Er 。 根 据 映射 可 归 约 的 定义 ， 用 同样 的 归 约 函 
数 可 得 出 Ar 入 m Erv ， 然 而 Erw 是 图 灵 可 识别 的 〈 参 见 练习 4.5 的 解答 )，Arw 却 不 是 图 灵 可 
识别 的 ， 这 与 定理 5. 22 矛盾 。 
假定 A<m B，Bm C ， 那 么 有 可 计算 函数 f 和 g 使 得 EASSf(z)EB,y€ Bg(y) EC。 考 虑 
复合 函数 h(x) 二 g(f(zx))， 构 造 一 个 图 灵机 按 以 下 方式 计算 hh: 首先， 用 一 个 图 灵机 模拟 f， 输 入 
为 xz， 输出 为 y (由 于 已 经 假设 f 是 可 计算 的 ， 所 以 这 样 的 图 灵机 是 存在 的 ); 然后， 用 一 个 图 灵 
机 模拟 g， 输 入 为 y， 输 出 为 h(x)= 二 g(f(x))， 因 此 有 是 可 计算 函数 ， 有 上 且 xEASh(l(zx)EC。 故 此 ， 
通过 归 约 函数 hh 有 A 和 <n C. 
假定 A 二 ms A， 那 么 通过 同样 的 映射 归 约 有 A 二。 A。 因 为 A 是 图 灵 可 识别 的 ， 所 以 根据 定理 5. 22 
可 推出 A 也 是 图 灵 可 识别 的 ， 再 由 定理 4.16 可 以 推出 A 是 可 判定 的 。 
需要 处 理 这 样 的 情况 : 读 写 头 已 经 到 达 带 子 的 最 左 端 格子 上 ， 但 仍然 试图 向 左 移动 。 为 此 对 于 每 
个 g，rEQ 和 a，pEFR， 可 增加 如 下 的 骨牌 : 

Eada 

# rb 

此 处 8(q,a)=(r,0,L)。 此 外 ， 若 读 写 头 在 第 一 步 试图 向 左 移动 ， 则 将 第 一 个 骨牌 替换 为 


ian! 
H # qo zol We °°" Wn 
用 反 证 法 ， 设 P 是 满足 属性 的 可 判定 语言 ， 并 设 Rp 就 是 一 个 判定 P 的 图 灵机 。 现 在 证 明 如 何 通 
过 构造 图 灵机 S, HA Rp 来 判定 Atw。 首 先 设 Tg 是 一 个 总 是 拒绝 的 图 灵机 ， 即 L(Tg )= 二 人 名。 不 失 
一 般 性 ， 可 以 假定 “Tg ) 人 多 已， 因为 若 (Te ;EP， 那 么 就 可 以 用 PP 蔡 代 PP KHET. hF P Æ 
非 平 凡 的 ， 所 以 存在 一 个 图 灵机 全 使 得 (T，〉E PP。 下 面 利用 Rp 能 够 区 别 Tg 和 工 的 能 力 设计 一 
个 可 以 判定 Arw 的 图 灵机 S: 
S 一 “对 于 输入 (M,w): 

1. 用 MA w 构造 下 面 的 图 灵机 M。 。 

Mu = 二 “对 于 输入 x: 
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a. 在 ww 上 模拟 M， 如 果 停 机 和 拒绝 ， 那 么 拒绝 。 
如 果 接 受 ， 则 进入 第 2 阶段 。 

b. Ex EWT, MRR, PAH.’ 
2. 用 图 灵机 Rp 确定 是 否 有 《MEP。 如 果 返 回 是 ， 那 么 接受 ; 如 果 返 回 否 ， 那 么 拒绝 。” 
如 果 M 接受 w， 那 么 图 灵机 Mu 可 以 模拟 工 。 如 果 M 接受 w ERD, PALM.) 等 于 
L(T)。 因 此 ， 当 且 仅 当 M 接受 四 时 〈MuwEP。 

5.18 a. INFINITETM 是 一 个 关于 图 灵机 描述 的 语言 ， 它 满足 赖 斯 定理 的 两 个 条 件 : 首先 ， 由 于 某 些 图 

灵机 有 无 限 的 语言 ， 但 另 一 些 却 没有 ， 所 以 它 是 非 平凡 的 ; 其 次 ， 它 仅仅 依赖 于 语言 。 所 以 如 
果 两 个 图 灵机 识别 同一 个 语言 ， 那 么 这 两 个 图 灵机 要 人 么 都 有 ,或 要 么 都 没有 相应 的 描述 在 
INFINITETM 之 中 。 因 此 ， 由 赖 斯 定理 可 以 推出 INFINITETM 是 不 可 判定 的 。 

5.26 it B={((M, w |M 是 一 个 双 带 图 灵机 ， 当 M 运行 在 w Ekt, 它 在 其 第 二 个 带子 上 写 一 个 非 空白 
符 }。 证 明 Arm BAR B。 为 了 得 到 了 矛盾， 设 图 灵机 R 可 判定 B。 构 造 图 灵机 S, €A 尺 来 判定 
AT o 
S=“Xt FRA (M,w): 

1. 用 M 构造 下 面 的 双 带 图 灵机 工 。 
T= 二 “对 于 输入 cz: 
a 在 x 上 用 第 一 个 带子 模拟 M 。 
b. 如 果 模 拟 表明 M 接受 ， 则 在 第 二 个 带子 上 写 一 个 非 空 白 符 。? 
2. Æ (T,w) 上 运行 R， 确 定 在 输入 w 上 本 是 否 在 第 二 个 带子 上 写 了 一 个 非 空 白 符 。 
3. WR R 接受 ， 则 M 接受 多 ， 因 此 接受 ， 否则 拒绝 。” 

5.27 R C={((M |M 是 双 带 图 灵机 , 当 它 运行 在 某 些 输 入 上 时 , 它 在 其 第 二 个 带子 上 写 一 个 非 空 白 符 }。 
证 明 Atrm 可 归 约 到 C。 为 了 得 到 矛盾 ， 设 图 灵机 R 可 判定 C。 构 造 图 灵机 S$， 它 用 尺 来 判定 ATrw 。 
S=“ FRA (M,w): 

1. H MA w 构造 下 面 的 双 带 图 灵机 TW 
Tu 一 “对 于 任何 输入 : 
a. 在 也 上 用 第 一 个 带子 模拟 M 。 
b. 如 果 模 拟 表明 M 接受 ， 则 在 第 二 个 带子 上 写 一 个 非 空 白 符 。? 
2 Æ (Ty) EZI R: 确定 Tw 是否 在 第 二 个 带子 上 写 了 一 个 非 空白 符 。 
3. WR RÉZ, M M 接受 w， 因 此 接受 ; 否则 拒绝 。” 
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本 章 更 深入 地 研究 可 计算 性 理论 中 的 下 列 四 个 专题 : (1) 递归 定理 ; (2) 逻辑 理论 ; 
(3) 图 灵 可 归 约 性 ; (4) 描述 复杂 性 。 除 了 在 逻辑 理论 一 节 的 结尾 应 用 了 递归 定理 外 ， 本 
章 各 节 基 本 上 相互 独立 。 本 书 中 第 三 部 分 也 不 依赖 于 本 章 的 内 容 。 


6.1 递归 定理 


递归 定理 (recursion theorem) 是 一 个 数学 结论 ， 在 可 计算 性 理论 的 高 级 研究 中 起 着 
重要 的 作用 。 它 与 数理 逻辑 、 自 再 生 系统 理论 以 及 计算 机 病毒 都 有 联系 。 

为 介绍 递归 定理 ， 考 察 与 生命 科学 相关 的 一 个 悖 论 ， 此 悖 论 是 关于 制造 这 样 一 个 机 
器 ， 它 要 构造 它 自 己 的 复制 品 。 这 个 悖 论 可 以 概述 如 下 : 

1. 生物 都 是 机 器 。 

2. 生物 都 能 自 再 生 。 

3. 机 器 不 能 自 再 生 。 

第 一 句 话 是 现代 生物 学 的 一 个 守则 ， 人 们 认为 生物 体 是 以 机 械 方式 运作 的 。 第 二 句 话 
明显 成 立 ， 目 再 生 能 力 是 每 个 生物 物种 的 本 质 特 征 。 对 第 三 句 话 作 如 下 讨论 。 考 虑 构造 其 
他 机 器 的 一 个 机 器 ， 比 如 生产 小 汽车 的 自动 生产 线 。 原 材料 从 一 端 进入 ， 加 工 机 器 人 根据 
指令 运行 ， 完 整 的 汽车 从 另 一 端 出 来 。 

可 以 断言 ， 在 如 下 意义 下 ， 生 产 线 肯 定 要 比 它 制造 的 汽车 复杂 : 设计 生产 线 要 比 设计 
汽车 更 困难 。 这 个 结论 必然 是 真 的 ， 因 为 生产 线 的 设计 中 除了 含有 加 工 机 器 人 的 设计 之 
外 ， 还 含有 汽车 的 设计 。 同 样 的 原因 适用 于 构造 机 器 B 的 机 器 A : A 肯定 要 比 B 复杂 。 但 
一 个 机 器 不 会 比 它 自己 更 复杂 。 因 此 没有 机 器 能 够 制造 它 自己 ， 故 自 再 生 是 不 可 能 的 。 

怎么 才能 解决 这 个 悖 论 呢 ?答案 很 简单 : 第 三 句 是 不 正确 的 。 制 造 能 生产 自己 的 机 器 
是 可 能 的 ， 递 归 定 理 就 是 说 明 怎 么 做 到 这 一 点 。 


6.1.1 自 引 用 


本 节 从 制造 一 个 图 灵机 开始 ， 此 图 灵机 忽略 输入 ， 且 打印 出 它 自 己 的 描述 。 我 们 称 这 
个 机 器 为 SELF。 为 描述 SELF， 需 要 下 面 的 引 理 。 
存在 可 计算 函数 g:5* 一 5* ， 对 任意 串 w, qw) 是 图 灵机 Pu HBR, 
Pu 打印 出 w， 然 后 停机 。 
证 明 一 旦 懂得 这 个 引 理 的 叙述 ,证 明 就 容易 了 。 显 然 ， 可 以 任 取 一 个 字符 串 w， 然 
后 从 它 构造 一 个 图 灵机 ， 使 得 此 图 灵机 将 w 内 装 在 一 个 表 中 。 这 样 ， 当 此 图 灵机 开始 运行 
后 ， 它 只 要 简单 输出 w 即 可 。 下 列 图 灵机 Q 计算 qw): 
Q=“Xt FRA w: 
1. 构造 下 列 图 灵机 Pau: 
P= 二 “对 于 任意 输入 : 
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a 抹 去 输入 。 
b. 在 带 上 写 下 w. 
c 和 停机。 

2 W KPata m 

图 灵机 SELF 有 两 个 部 分 ， aE AMB., BRAM BHPAMATT ANU. € 
们 一 起 组 成 SELF。 我 们 希望 SELF 打印 出 (SELF) =(AB}. 

A 部 分 首先 运行 ， 再 根据 完成 情况 将 控制 传 给 B. A 的 任务 是 打印 出 B 的 描述 。 反 过 
来 ，B 的 任务 是 打印 出 A 的 描述 ， 结 果 就 是 希望 的 SELF 的 描述 。 这 两 个 任务 相似 ,但 
它们 的 实现 却 不 同 。 先 来 说 明 怎 么 构造 A 部 分 。 

使 用 机 器 Ps) 来 定义 A, HP Pie MAX g Æ (B) AWE gB) 描述 ， 这 样 ，A 
部 分 是 一 个 打印 出 (B) 的 图 灵机 。A 的 描述 依赖 于 是 否 已 经 有 了 B 的 描述 ， 所 以 在 构造 
出 B 之前， 无 法 完成 A 的 描述 。 

对 于 B 部 分 ， 你 也 许 十 分 想 用 9((A)) 来 定义 ,但 这 不 可 行 。 这 样 做 将 是 用 A RE 
义 B， 而 定义 A 又 要 根据 B。 此 即 所 谓 循 环 定 义 (circular definition)， 是 违背 逻辑 法 则 
的 。 用 男 一 种 方法 来 定义 B， 使 之 能 打印 A: BMA 产生 的 输出 来 计算 A。 

定义 “A〉 是 g(《(B))。 FRE RFR: WR B 能 得 到 〈(B，， 它 就 能 应 用 q 来 得 到 
(A). 但 B 怎 么 做 才能 得 到 〈B〉 呢 ? 当 A 结束 时 ， 它 被 留 在 带子 上 。 所 以 B 只 要 看 着 带 
子 就 能 得 到 (B)。 在 计算 gq((B))= 二 (A〉 之 后 ，B 将 之 加 到 带子 的 前 面 ， 然 后 将 A 和 B 组 
合成 一 个 机 器 并 在 带子 上 写 下 它 的 描述 (AB) = 二 (SELF)。 总 之 ， 

A=Psp;, H 

B= 对 于 答 人 《My ， 其 申 胡 是 一 个 图 灵机 的 一 部 分 ， 

1. 计算 aM), 
2. 将 其 结果 与 (M) 结合 来 组 成 一 个 完整 的 图 灵机 描述 。 
3. 打印 这 个 描述 ， 然 后 停机 。” 

至 此 ， 完 成 了 SELF 的 构造 。 图 6-1 为 SELF 
的 示意 图 。 

如 果 现 在 运行 SELF， 能 观察 到 如 下 动作 : 






SELF 的 控制 器 MEDIS tai 


1. 首先 A 运行 ， 它 在 带子 上 打印 (B); 图 6-1 SELF 的 示意 图 ， 一 个 打印 
2. B 开始 运行 ， 它 查看 带子 ， 找 到 它 的 输入 (B); 它 自己 的 描述 的 图 灵机 


3. BB 计算 CB) =A), RaZ (B) 合并， 构成 图 灵机 SELF 的 描述 (SELF); 
4. B 打印 这 个 描述 ， 且 停机 。 
容易 用 任何 程序 设计 语言 实现 这 个 构造 ， 即 得 到 一 个 程序 ， 输 出 就 是 它 自己 。 甚 至 用 
普通 的 英语 都 能 做 到 这 一 点 。 假 如 想 构造 一 个 英语 句子 ， 它 要 求 读者 打印 出 与 这 个 句子 相 
同 的 句子 。 一 个 方法 是 造 下 面 的 句子 : 
打印 这 个 语句 
这 个 语句 有 我 们 想 要 的 含义 ， 因 为 它 指 示 读 者 打印 出 这 个 语句 本 身 。 但 它 没有 明确 地 翻译 
成 程序 设计 语言 ， 因 为 这 个 句子 中 的 自 引用 词 “ 这 个 ”通常 没有 对 应 物 。 但 在 构造 这 样 的 
句子 时 ， 也 不 是 非 要 用 自 引 用 词 不 可 。 考 虑 下 面 的 变换 
打印 下 面 语句 的 两 个 副本 ， 在 第 二 个 副本 上 加 引号 : 
“打印 下 面 语句 的 两 个 副本 ， 在 第 二 个 副本 上 加 引号 :” 
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在 这 个 句子 中 ， 自 引用 词 被 一 个 同样 的 构造 所 取代 ， 这 样 的 构造 曾 被 用 来 制造 图 灵机 
SELF。 本 引 理 中 ，B 部 分 的 构造 是 如 下 的 句子 : 
打印 下 面 语句 的 两 个 副本 ， 在 第 二 个 副本 上 加 引号 : 

A 部 分 与 之 相同 ， 只 是 用 引号 将 之 括 起 来 。A 提供 了 B 的 一 个 副本 给 B， 所 以 B 就 可 以 像 
图 灵机 一 样 来 处 理 那 个 副本 。 

递归 定理 提供 了 以 任意 程序 设计 语言 实现 自 引 用 词 “ 这 个 ”的 能 力 。 Sap eiai 
任何 程序 设计 语言 都 有 引用 它 目 己 的 描述 的 能 力 。 下 面 将 看 到 它 的 一 些 应 用 ， 在 讨论 
We 
一 个 程序 不 仅 能 得 到 它 自 己 的 描述 ， 而 且 还 能 用 这 个 描述 继续 进行 计算 ， 而 不 是 仅仅 将 之 
打印 出 来 。 

GET) hz) 设 荆 是 计算 函数 1: 5* X S* -> 5* 的 一 个 图 灵机 。 则 存在 
+H BRMr:>* 一 5* 的 一 个 图 灵机 RR， 使 得 对 每 一 个 w， 有 : 

r(w)=t((R) ,w) 

初 看 之 下 ， 此 定理 的 叙述 技术 性 很 强 ， 但 实际 上 ， 它 代表 的 事情 很 简单。 为 了 制造 一 
个 能 得 到 目 己 的 描述 ， 并 用 它 计 算 图 灵机 ， 只 需要 制造 一 个 在 上 述 和 定理 中 称 为 工 的 图 灵 
机 ， 使 之 以 自己 的 描述 作为 输入 的 一 部 分 。 然 后 递归 定理 就 产生 一 个 新 的 机 器 R， 它 和 
一 样 运 行 ， 只 是 R 的 描述 被 自动 地 装 在 本 中 。 

证 明 此 证 明 与 SELF 的 构造 类 似 ， 分 三 部 
分 A、B 和 工 来 构造 图 灵机 R， 其 中 全 由 定理 的 
叙述 给 出 。 图 6-2 是 R 的 图 示 。 

Aditi q((BT)) 描述 的 图 灵机 Por. AT M-E EA 
保持 输入 w， 我 们 重新 设计 g， 使 得 Psr; 印 出 任何 预先 在 带子 上 存在 的 串 的 输出 。 在 A 
运行 之 后 ， 带 子 上 包含 w(BT). 

B 还 是 如 下 的 过 程 : 检查 带子 ， 并 将 g 应 用 于 带子 内 容 ， 结 果 是 (A). RMA BRA, 
B 和 三 组 合成 一 个 图 灵机 并 得 到 它 的 描述 (ABT)=(R)。 最 后 ， 描 述 的 编码 和 也 结合 ， 在 
带子 上 形成 结果 串 (R,w)， 并 将 控制 传 给 工 。 天 


6.1.2 递归 定理 的 术语 


递归 定理 指出 图 灵机 可 以 输出 自己 的 描述 ， 然 后 还 能 用 它 继续 进行 计算 。 初 一 看 ， 这 
个 能 力 只 是 对 一 些 无 意义 的 任务 有 用 ， 如 制造 一 个 打印 它 自 己 的 备份 的 机 器 。 实 际 上 ， 下 
面 会 介绍 递归 定理 是 解决 某 些 与 算法 理论 有 关 的 问题 的 有 力 工 具 。 

在 设计 图 灵机 算法 时 ， 可 用 如 下 方式 使 用 递归 定理。 如 果 你 正在 设计 一 个 图 灵机 M, 
则 可 以 在 M 的 算法 的 非 形式 描述 中 包含 如 下 短语 : “得 到 自己 的 描述 〈“M)”。 一 旦 得 到 自 
己 的 描述 ，M 就 能 像 使 用 其 他 已 计算 出 来 的 值 一 样 使 用 这 个 描述 。 例 如 ，M 可 以 简单 打 
印 出 “M);， 就 像 前 面 在 图 灵机 SELF 遇 到 的 一 样 ; 或 者 计算 (M，〉 中 的 状态 数 ; 或 模拟 
《M)。 为 了 说 明 这 个 方法 ， 用 递归 定理 来 描述 机 器 SELF: 

SELF= 二 “对 于 任意 输入 : 

1. 利用 递归 定理 得 到 它 自己 的 描述 (SELF). 
2. JE SELFI,” 
递归 定理 展示 了 怎样 实现 “获得 自己 的 描述 ”的 构造 。 为 了 产生 机 器 SELF， 首 先 写 
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PUP Las T: 
T 一 “对 于 输入 (M,w): 
1. 打印 (M) 并 停机 。?” 
图 灵机 全 得 到 图 灵机 M 和 它 输 入 的 串 w 的 描述 ， 它 打印 了 M 的 描述 〈M)。 然 后 递 
归 定 理 展示 怎样 获得 在 输入 w 上 的 图 灵机 RR, 像 工 在 输入 〈‘R,w〉 上 那样 操作 。 因 此 R 
打印 出 R 的 描述 ， 恰 好 是 机 器 SELF 所 需要 得 到 的 。 


6. 1.3 应 用 


计算 机 病毒 (computer virus) 是 一 个 计算 机 程序 ， 它 被 设计 成 在 计算 机 中 传播 它 自 
己 。 顾 名 思 义 ， 它 与 生物 病毒 有 许多 共同 的 地 方 。 计 算 机 病毒 作为 一 段 代 码 而 单独 存在 
时 ， 是 不 活动 的 ， 但 是 ， 当 把 它 适 当地 放 和 人 宿主 计算 机 从 而 “感染 ” 它 时 ， 它 就 变 得 很 活 
跃 ， 传 染 它 自己 的 副本 给 其 他 易 受 感染 的 机 器 。 很 多 媒介 都 能 传播 病毒 ， 包 括 互联 网 络 和 
可 存 取 磁盘 。 为 了 实现 自 复制 的 基本 任务 ， 一 个 病毒 可 能 就 包含 递归 定理 的 证 明 中 所 描述 
的 结构 。 
现在 讨论 用 递归 定理 来 证 明 的 三 个 定理 ， 还 有 一 个 应 用 出 现在 6. 2 节 的 定理 6. 15 中 。 
首先 回 到 Arw 不 可 判定 性 的 证 明 。 以 前 在 定理 4. 9 中 曾 用 康 托 对 角 化 法 证 明 过 它 ， 递 
归 定 理 提供 了 一 个 新 的 、 更 简单 的 证 明 方法 。 
ATM 是 不 可 判定 的 。 
证 明 为 了 得 到 矛盾 ， 假 设 图 灵机 五 可 判定 Arx。 构 造 下 列 图 灵机 B。 
B= 二 “对 于 输入 w: 
1. 由 递归 定理 得 到 自己 的 一 个 描述 CB). 
2. 在 输入 (Bw) 上 运行 H. 
3. 得 到 与 互相 反 的 结果 ， 即 : 如 果 互 拒绝 ， 则 接受 ; 如 果 电 接受 ， 则 拒绝 。” 
Aw, BABAR HAR, PU 五 不 可 能 判定 Ar 。 证 毕 。 a 
下 面 是 递归 定理 的 另 一 个 应 用 。 
如 果 M 是 一 个 图 灵机 ， 则 M 的 描述 (M) 的 长 度 是 描述 M 的 串 中 所 含 符号 
的 个 数 。 如 果 没 有 与 M 等 价 的 图 灵机 有 更 短 的 描述 ， 则 称 M 是 最 小 的 (minimal), + 
MINm=({(M)|M 是 一 个 最 小 图 灵机 ) 
MINTM 不 是 图 灵 可 识别 的 。 
证 明 假设 图 灵机 五 枚 举 MINTm， 然 后 试图 来 得 到 了 矛盾。 构造 下 列 图 灵机 C. 
C= 二 “对 于 输入 w: 
1. 由 递归 定理 得 到 它 自 己 的 一 个 描述 O. 
2. 运行 枚 举 器 正 ， 直 到 一 个 比 C 的 描述 更 长 的 机 器 D 出 现 。 
3. 在 输入 w 上 模拟 D。” 
因为 MINTrM 是 无 限 的 ， 故 五 的 序列 中 必定 含有 图 灵机 ， 其 描述 比 C 的 描述 更 长 。 因 
K, 的 第 二 步 最 终 将 在 某 个 图 灵机 上 终止 ， 且 D 比 C 更 长 。 然 后 C 就 模拟 DD， 且 与 
之 等 价 ， 因 为 C 比 D 短 且 与 之 等 价 ， 故 DD 不 可 能 是 最 小 的 , 但 DD MEE 产生 的 序列 中 出 
现 ， 这 样 就 得 到 了 了 矛盾 。 s 
递归 定理 的 最 后 一 个 应 用 是 一 类 不 动 点 定理 。 函 数 的 一 个 不 动 点 (fixed point) 是 一 
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个 值 ， 函 数 施加 在 该 值 上 ， 得 到 的 结果 还 是 它 。 现 在 考虑 图 灵机 描述 的 可 计算 的 转换 函 
数 ， 我 们 将 证 明 : 对 任意 一 个 这 样 的 转换 ， 都 存在 一 个 图 灵机 ， 使 得 它 的 行为 不 随 这 个 转 
换 而 改变 。 这 个 定理 被 称 为 递归 定理 的 不 动 点 形式 。 
H> 是 一 个 可 计算 函数 ， 则 存在 一 个 图 灵机 下， 使 得 iLLF)) 描 
述 一 个 与 下 等 价 的 图 灵机 。 这 里 假设 如 果 串 不 是 一 个 正确 的 图 灵机 编码 ， 那 么 它 描述 的 图 
灵机 立即 拒绝 。 
在 这 个 定理 中 ,上 起 着 转换 的 作用 ，F 下 是 不 动 点 。 
证 明 设 下 是 下 列 图 灵机 。 
下 一 “对 于 输入 w: 
1. 由 递归 定理 得 到 它 自己 的 一 个 描述 (CF). 
2. 计算 i:(《F)) 得 到 一 个 图 灵机 G 的 描述 。 
3. 在 输入 w 上 模拟 G。” 
显然 ，(F〉 和 t(《F)) 二 (G〉 描 述 了 等 价 的 图 灵机 ， 因 为 下 模拟 G。 a 


6.2 逻辑 理论 的 可 判定 性 


数理 逻辑 是 数学 的 一 个 分 文 ， 它 研究 数学 本 号 。 它 关心 如 下 的 问题 什么 是 定理 ? 什 
么 是 证 明 ? 什么 是 真 ? 算法 能 判定 哪些 命题 是 真 的 呢 ? 所 有 真 命题 都 是 可 证 的 吗 ? 在 这 个 
丰富 而 迷人 的 领域 中 ， 我 们 将 接触 某 些 专题 。 

我 们 关心 的 焦点 是 这 样 的 问题 : 能 否 确定 一 个 数学 命题 是 真 还 是 假 以 及 这 种 问题 的 可 
判定 性 。 答 案 依 赖 于 命题 勾 勤 的 数学 域 。 我 们 将 检查 两 个 域 : 对 于 其 中 一 个 ， 能 给 出 算法 
来 判定 真 假 ; 对 于 另 一 个 ， 这 个 问题 是 不 可 判定 的 。 

首先 需要 建立 一 个 精确 的 语言 来 将 这 些 问题 形式 化 。 我 们 的 要 求 是 能 够 考虑 如 下 数学 
命题 : 

1. Vasa pVayLpoaA (x,y>1—>zyF Pp) | 

2. Wasbscon [| (a,b,c>0 An>2)—a* +o" Hc" | 

3. Vad pVazoy LpogA (z, y>l>(zrzyÆpNryÆp+2))] 

命题 1 称 ， 有 无 限 多 个 素数 存在 ， 在 大 约 2300 年 以 前 的 欧 几 里 得 时 代 ， 就 已 知道 这 
个 命题 是 真 的 。 命 题 2 称 为 费 马 大 定理 (Fermat's last theorem) ， 这 个 命题 在 1994 年 由 
安德鲁 。 威尔士 (Andrew Wiles) 证 明 为 真 。 最 后 ， 命 题 3 称 ， 有 无 限 多 个 素数 对 9 F 
在 ， 这 被 称 为 李 生 素数 猜想 (twin prime conjecture) 。 它 到 现在 还 未 被 解决 。 

为 了 研究 能 否 将 确定 真 命题 的 过 程 自动 化 ， 首 先 把 命题 都 仅仅 看 作 串 ， 再 定义 一 个 语 
言 ， 这 个 语言 由 所 有 的 真 命题 组 成 ; 然后 问 : 这 个 语言 是 否 是 可 判定 的 。 

为 了 将 之 进一步 精确 化 ， 现 在 描述 这 个 语言 的 字母 表 : 

Ys Vaze dR Rs 
符号 和信，V， 一 称 为 布尔 运算 (Boolean operation); “ (” 和 “)” 是 插 号 (parenthesis); 
符号 YV 和 了 是 量词 (quantifier); 符号 zx 用 来 代表 变 元 SS (variable); 符号 R1,…,R RH 


O 素数 对 是 指 两 个 差 为 2 的 素数 。 
加 ”如 果 在 同一 个 公式 中 写 多 个 变 元 ， 使 用 符号 w, y, zR m, r, rn 等 。 为 了 保持 字母 表 的 有 限 性 ， 不 罗列 所 有 
无 限 多 个 可 能 。 取 而 代 之 ， 只 罗列 变量 符号 zx， 使 用 关 串 来 指示 其 他 变 元 ， 如 zz 代表 r, rer AR zs， 等 等 。 
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关系 (relation), 

公式 (formula) 是 这 个 字母 表 上 的 恨 构 串 。 为 完整 起 见 ， 这 里 将 概略 地 叙述 良 构 公 
IRO (well-formed formula) 的 技术 上 的 定义 。 你 可 以 忽略 这 部 分 内 容 从 下 一 段 继续 ， 不 影 
啊 学 习 。 形 如 R: Csr) 的 串 是 原子 公式 (atomic formula). É j 是 关系 符号 R; 的 元 
数 (arity) 。 一 个 恨 构 公 式 中 所 有 出 现 的 相同 关系 符号 必须 有 相同 的 元 数 。 据 此 ， 一 个 串 
点 如 满足 以 下 条 件 ， 则 是 一 个 公子 

lL. TETEN 

2. 具有 形式 gi Ado Mo V Kod, HP di 和 82 是 更 小 的 公式 ; 

3. 具有 形式 jzilyij RV algi], EF gpi 是 更 小 的 公式 。 

数学 命题 中 的 量词 可 能 出 现在 任何 地 方 。 它 的 辖 域 (scope) 是 公式 的 如 下 部 分 : 紧 
跟 在 量词 化 变 元 后 的 一 对 括号 中 的 部 分 。 现 在 假设 所 有 公式 都 是 前 束 范 式 〈prenex normal 
form)， 即 所 有 量词 都 出 现在 公式 的 前 面 。 没 有 被 量词 的 辖 域 所 约束 的 变 元 称 为 自由 变 元 
(free variable)。 没 有 自由 变 元 的 公式 称 为 句子 (sentence) 或 命题 (statement), 

在 下 列 公式 中 ， 只 有 最 后 一 个 是 句子 : 

1. Ry (21) A Reo (2x1 smo 523) 

2. Vai LRi (21) AR2(21 522 5x3) | 

3. Va. 3 Aal Ri (21) A R2(21 522523) | # 

建立 了 公式 的 语法 之 后 ， 现 在 来 讨论 它们 的 含义 。 布 尔 运算 和 量词 与 通常 的 含义 相 
同 。 为 了 确定 变 元 和 关系 符号 的 含义 ， 需 要 说 明 两 个 方面 : 一 个 是 论 域 (universe)， 和 覆盖 
变 元 可 能 的 取 值 ; 男 一 个 是 将 关系 符号 指定 为 确定 的 关系 。 正 如 0. 2 节 所 描述 的 ， 关 系 是 
MEREK k WHARA {TRUE, FALSE) 的 函数 。 关 系 符 号 的 元 数 必 须 和 指派 给 它 的 关系 
和 元 数 一 致 。 

论 域 连同 关系 到 关系 符号 的 指派 一 起 称 为 模型 (model)。 形 式 上 ， 我 们 说 一 个 模型 
M 是 一 个 元 组 (U, Pis, Pi), AFP U ERR, Pi BP. 是 指派 给 符号 Ri BHR 的 关系 。 
有 时 称 下 列 公 式 的 集合 为 模型 语言 : 这 些 公 式 只 使 用 此 模型 指派 的 关系 符号 ， 且 对 每 个 关 
系 符 号 ， 使 用 正确 的 元 数 。 如 果 8 是 某 个 模型 语言 中 的 句子 ， 则 g 在 这 个 模型 中 不 为 真 就 
AK. WR p 在 模型 M 中 为 真 ， 则 说 M 是 的 一 个 模型 。 

如 果 你 感到 这 些 概念 难以 理解 ， 请 将 注意 力 集中 在 氢 述 它们 的 目的 上 ， 即 我 们 想 建立 
一 个 陈述 数学 命题 的 精确 语言 ， 使 得 我 们 能 问 : 某 个 算法 能 否 确 定 哪 些 是 真 命 题 、 哪 些 是 
假 命 题 ? 下 面 的 例子 应 能 有 助 于 理解 。 

设 $ EAF Y cY y [Ri(zx,y)V Ri(y,7x)]， 模 型 M =N, <) 是 如 下 的 模 
型 : 它 的 论 域 是 自然 数 集 ， 它 将 “小 于 或 等 于 ”关系 分 配给 符号 R. BA p 在 Mi 中 为 
真 ， 因 为 对 任意 两 个 自然 数 a Alb, ab Mb<a 必 有 一 个 成 立 。 但 如 果 Mi 将 “小 于 ” 关 
系 〈 而 不 是 “小 于 或 等 于 ”关系 ) 指派 给 Ri ， 则 8 将 不 真 ， 因 为 当 z 和 >y 相等 时 ， 它 不 
再 成 立 。 

如 果 事 先知 道 什么 关系 将 指派 给 R;， 就 可 以 使 用 这 个 关系 的 惯用 记号 来 代 兰 R, H 
按 习 惯 ， 如 果 习 惯 上 有 ， 就 使 用 中 缀 记 法 而 不 是 前 级 记 法 。 这 样 ， 对 于 模型 M1， 可 以 将 


O 良 构 公式 在 有 些 书 中 被 称 为 合式 公式 。 一 一 译 者 注 
日 模型 又 被 称 为 解释 或 结构 。 
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$ 写成 WYxVy Lz<yV ysr]. = 

GRED 设 M: 是 如 下 的 模型 : 它 的 论 域 是 实数 集 R， 且 将 关系 PLUS 指派 给 Ri ， 
其 中 : 只 要 当 atb=c hf PLUS(a,6,c)=TRUE, M) M Æ ¢4=VydzlRilz.z,y)] 的 
一 个 模型 。 但 如 果 用 N 代替 R 作为 M 的 论 域 ， 则 此 句子 为 假 。 

如 同 前 一 个 例子 ， 因 为 事先 已 经 知道 加 法 关系 将 指派 给 Ri， 故 可 将 几 写 为 Vy 了 z 
Letr=y] UBRV yd2zLRi(z,z,y)]. s 

如 例 6.9 HARARE, FI WKAR AA MAKARS ARR. KW. E 
可 以 用 关系 来 表示 常量 ， 像 0 和 1. 

现在 给 出 最 后 一 个 定义 ， 为 下 一 节 做 准备 。 如 果 A4 是 一 个 模型 ， 这 个 模型 语言 中 所 有 
真 句 子 的 集合 称 为 AM 人 的 理论 系统 ， 人 简称 为 理论 ， 记 为 Thm). 


6.2.1 一 个 可 判定 的 理论 


数论 是 最 古老 、 最 困难 的 数学 分 支 之 一 。 许 多 关于 自然 数 及 其 加 法 和 乘法 运算 的 命题 
看 起 来 很 简单 ， 但 几 个 世纪 以 来 ， 数 学 家 对 此 都 束手无策 ， 如 前 面 提 到 的 挛 生 素数 猜想 。 

数理 逻辑 最 值得 庆贺 的 发 展 之 一 是 : 在 哥 德 尔 工作 的 基础 上 ， 丘 奇 证 明了 存在 这 样 
的 数论 命题 ， 使 得 没有 算法 能 够 判定 它 的 真 假 。 形 式 上 ， 以 (N, 十 , XX) 标记 如 下 的 模 
型 它 的 论 域 是 自然 数 集 8 ,具有 通常 的 十 和 XX 关系 。 丘 奇 证 明了 这 个 模型 的 理论 
Th(N, +,X) 是 不 可 判定 的 。 

在 研究 这 个 不 可 判定 理论 之 前 ， 先 来 介绍 一 个 可 判定 理论 。 设 CN, 十 ) 是 一 个 同样 的 
模型 ， 只 是 没有 X 关 系 。 它 的 理论 是 ThCN, 十 )， 例 如 公式 VzVy [zx 十 zx 二 y]」 是 真 的 ， 
因而 是 THC(N, 十 》 的 一 个 元 素 。 但 公式 Vy3zLzx 十 z= 二 y]」 ZEN. AMA THN, +) 
的 一 个 元 素 。 

CS ThN, +) 是 可 判定 的 。 

证 明 思 路 ”此 证 明 是 第 1 章 介 绍 的 有 穷 自 动机 理论 的 一 个 有 意思 的 、 非 平凡 的 应 用 。 
我 们 要 用 到 问题 1. 37 中 关于 有 穷 自 动机 的 如 下 事实 : 如 果 输 入 符合 某 种 特定 形式 ， 则 有 
穷 自动 机 能 够 做 加 法 。 输 入 并 行 地 描述 三 个 数 ， 方 法 是 : 用 一 个 符号 来 表示 每 个 数 中 的 一 
位 ， 此 符号 取 自 一 个 含 8 个 符号 的 字母 表 。 下 面 将 用 的 方法 是 这 个 方法 的 一 个 推广 ， 用 含 
2: 个 符号 的 字母 表 中 的 符号 来 表示 数 的 ; 元 组 。 

下 面 给 出 一 个 算法 ， 对 输入 为 N, +) 的 语言 中 的 句子 $6， 检查 其 在 模型 中 是 否 为 
K. i 





=Q r Q212" Qırıl y] 
EP: Qi ,…,Q: 表 示 V 或 3， 是 一 个 无 量词 的 公式 ， 且 含有 变 元 xX1，… ,zxi:。 对 于 从 0 到 
/的 每 一 个 但 ze CAH 上 为 
$i = QiHzZi+IQi+H2ZiH QiLO 
这 样 ，yo 王 上 ， 且 g= g. 
公式 点 Ai ABE, HF assai EN, Æ $i; 中 用 a1,…,ai RREJT is 
得 到 的 句子 记 为 $i(a1l,*… ,ai)。 


Ə 为 了 方便 ， 本 章 将 N 的 通常 定义 改变 成 人 
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对 于 从 0 到 1 的 每 一 个 值 i， 算 法 构造 了 一 个 有 穷 自动 机 A;,， 它 识别 如 下 串 的 集合 : 
这 些 串 表示 使 点 为 真 的 数 的 i 元 组 .算法 先 直接 构造 A,， 构 造 方法 是 解 问题 1. 37 所 用 方 
法 的 推广 。 然 后 ， 对 从 /向 下 到 WBS i, CHA 构造 A;-1。 最 后 ,一 旦 得 到 A, A 
法 就 检查 A 是 否 接 受 空 串 。 如 果 接 受 ， 则 y 为 真 ， 算 法 也 就 接受 。 

证 明 对 ;之 0， 定 义 字 母 表 


0 0 0 0 1 

DY, — i s l 。 9 os 
0 0 l 1 ] 
0 1 l 


则 53; 包含 了 所 有 由 0 M 1AE i jE. D 上 的 每 个 串 表 示 : 的 二 进 制 整数 AT 
访 )。 令 高 二 4| J}, WP L 是 一 个 符号 、 

现在 介绍 判定 THON, +) HR. MMA g RP p NAT), 算法 如 下 运行 : S 
下 $8， 且 对 从 0 到 7 的 每 个 i， 如 同 在 证 明 思 路 中 介绍 的 那样 定义 8;。 再 对 每 个 这 样 的 i， 
由 构造 有 穷 自动 机 A;， 使 得 只 要 $8;(al,…,ai;) 为 真 ， 它 就 接受 3; 上 对 应 于 1i 元 组 
ais ,ai WH. A 的 构造 如 下 : 

为 构造 第 一 个 机 器 A,， 注 意 到 $1 二 yy 是 原子 公式 的 布尔 组 合 。Th(N, 十 ) 的 语言 中 ， 
原子 公式 只 有 单个 加 法 。 对 每 个 这 样 的 单个 加 法 ， 可 以 构造 一 个 有 穷 上 自动 机 来 计算 这 样 的 
单个 加 法 所 对 应 的 关系 ， 然 后 将 这 些 有 穷 自 动机 组 合 起 来 ， 就 能 给 出 自动 机 A,。 这 样 做 
要 涉及 正则 语言 类 对 于 交 、 并 和 补 的 封闭 性 ， 以 计算 原子 公式 的 布尔 组 合 。 

接 下 来 说 明 怎 么 由 A;+1 来 构造 A;。 如 果 $; 二 zxitigi+1， 则 构造 A; 使 得 它 的 运行 
几乎 与 Ai+i1 一 样 ， 区 别 在 于 A 非 确 定 地 猜 ai+l 的 值 ， 而 不 是 将 它 作 为 输入 的 一 部 分 而 
接收 。 

更 精确 地 说 ， 对 于 Ai+1 的 每 个 状态 ，A; 包含 一 个 与 之 对 应 的 状态 ; HA 还 包含 一 个 
新 的 起 始 状 态 。 每 当 A; 读 下列 符 号 时 ， 


这 里 每 个 5; E10,1} 是 数 a; 的 某 一 位 ， 它 非 确 定 地 猜测 zE {0,1}， 且 在 下 列 输入 符号 上 
模拟 Ait. 


最 初 ，A; 非 确 定 地 猜测 ai+1 的 引导 位 ， 这 些 引 导 位 对 应 于 al 到 a; 中 隐藏 的 引导 0。 猜 测 
的 方法 是 : 从 它 新 的 起 始 状态 到 所 有 状态 非 确定 性 地 使 用 e 转移 进行 分 又 ， 这 些 状 态 是 
Aiti A 3;+1 中 下 列 符号 的 串 为 输入 、 从 它 的 开始 状态 所 能 到 达 的 所 有 状态 。 
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0 0 
ARAE: 
0 1 


显然 ， 如 果 存 在 a;+1， 使 得 Ai+1 接 受 (aise ,aiti), WA 接受 (al，,…,ai)。 

如 果 pi = Y ritigi CSR Jari 641. AWB A+ NANA 
自动 机 ， 然 后 应 用 上 述 对 于 了 量词 的 构造 ， 最 后 再 一 次 应 用 补 来 得 到 A, 。 

有 穷 自动 机 Au 接受 某 个 输入 ， 当 且 仅 当 po 为 真 。 所 以 算法 的 最 后 步骤 是 检查 A 是 
否 接受 s。 如 果 是 ， 则 为 真 ， 且 算法 接受 它 ; 否则 ， 就 拒绝 。 i 


6.2.2 一 个 不 可 判定 的 理论 


如 前 所 述 ，Th(N, 十 ,X) 是 一 个 不 可 判定 的 理论 ， 不 存在 算法 能 够 判定 数学 命题 的 
真 假 ， 即 使 限制 到 CN, 十 ,X) 的 语言 上 也 是 如 此 。 这 个 定理 在 哲学 上 具有 极 大 的 重要 人 性， 
因为 它 说 明了 数学 不 能 被 机 械 化 。 现 在 陈述 这 个 定理 ， 但 只 给 出 一 个 简短 的 证 明 概 要 。 

Th(N, 十 ,X) 是 不 可 判定 的 。 

虽然 这 个 定理 的 证 明 包含 很 多 细节 ， 但 在 概念 上 并 不 困难 。 它 使 用 了 第 4 章 中 介绍 的 
不 可 判定 性 证 明 的 模式 ， 即 通过 将 Arm JB ThCN, 十 ,X) 来 证 明 Th(N,+,X) 的 不 
可 判定 性 ， 也 使 用 了 计算 历史 的 方法 。 归 约 的 存在 性 依赖 于 下 列 引 理 。 

设 M 是 一 个 图 灵机 ， ww 是 一 个 囊 ， 从 M 和 也 能 构造 (N, 十 ,X) 的 语 
言 中 的 公式 gw， 使 得 它 只 包含 单个 自由 变 元 ZX， 且 句子 了 3zgwuo 为 真 当 且 仅 当 M 接 
LW 

证 明 思 路 公式 pmu “W r (经 过 适当 编码 ) 是 M 在 w 上 的 一 个 接受 计算 历史 。 
HR, r 实际 上 只 是 一 个 相当 大 的 整数 ， 但 它 表 示 计 算 历 史 的 方式 可 以 使 用 十 和 XX 运算 来 
检查 。 

$M,w 的 实际 构造 太 复 杂 ， 难 于 在 这 里 介绍 。 它 在 带 有 十 和 XX 运算 的 计算 历史 中 抽取 个 
体 符号 来 检查 M Ew 上 的 起 始 格局 是 否 正 确 ， 检 查 每 个 格局 是 否 是 它 前 一 个 格局 的 合法 
转移 ， 最 后 检查 最 后 的 格局 是 否 被 接受 。 

定理 6. 11 的 证 明 ”下面 给 出 一 个 从 Arm 到 Th(N, 十 ,X) 的 映射 归 约 。 这 个 归 约 应 用 
引 理 6. 12 MWA (M, w) 构造 公式 $Mm,w， 然 后 它 输 出 句子 3zgw,u。 m 

下 面 大 致 说 明 值 得 庆贺 的 哥 德 尔 (Kurt Gödels) 不 完全 性 定理 (incompleteness the- 
orem) 的 证 明 。 非 形式 地 ， 这 个 定理 称 : 任何 关于 数论 可 证 性 概念 的 形式 系统 中 都 含有 不 
可 证 的 真 命 题 。 

粗略 地 说 ， 一 个 命题 ¢ 的 形式 证 明 (formal proof) x 是 命题 的 一 个 序列 Si ,Sz ,…， 
Sı, FP S =¢, HEA S: 都 是 如 下 得 到 的 : 由 它 前 面 的 一 些 命题 和 一 些 关 于 数 的 基本 公 
理 ， 应 用 简单 而 精确 的 应 用 规则 得 到 。 为 节省 篇 幅 ， 本 书 没 有 定义 这 个 证 明 的 概念 ， 就 我 
们 的 目的 而 言 ， 关 于 证 明 的 下 面 两 个 合理 性 质 已 足够 使 用 : 

1. 命题 证 明 的 正确 性 可 以 由 机 器 来 检查 。 形 式 上 表示 ，(《(8,x) x Æ gp 的 一 个 证 明 ) 
是 可 判定 的 。 

2. 证 明 系 统 是 可 靠 的 ， 即 一 个 命题 如 果 是 可 证 的 〈 即 有 一 个 证 明 )， 则 它 为 真 。 
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如 果 一 个 可 证 性 系统 满足 这 两 个 条 件 ， 则 下 面 三 个 定理 成 立 。 

Th(N, 十 ,X) 中 可 证 命题 的 集合 是 图 灵 可 识别 的 。 

证 明 如果 是 可 证 的 ， 则 下 列 算法 P 接受 其 输入 sp。 算法 PP 使 用 在 可 证 性 性 质 1 中 
所 说 的 证 明 检 查 器 ， 检 查 每 个 可 能 成 为 $ 的 证 明 的 候选 串 。 如 果 发 现 一 个 候选 串 正 是 一 个 
证 明 ， 则 接受 它 。 

现在 使 用 前 面 的 定理 来 证 明 不 完全 性 定理 。 

Th(N,+,X) 中 存在 不 可 证 的 真 命题 。 

证 明 用 反 证 法 。 假 设 所 有 真 命题 都 是 可 证 的 ， 利 用 这 个 假设 来 构造 判定 命题 是 否 为 
真 的 算法 D， 与 定理 6. 11 矛盾 。 

对 于 输入 4， 算法 D 如 下 运行 : 在 输入 p 和 一 g 上 并 行 地 运行 定理 6. 13 的 证 明 中 给 出 
的 算法 P。 这 两 个 命题 总 有 一 个 为 真 ， 根 据 假 设 ， 总 有 一 个 是 可 证 的 。 因 而 PP 在 其 中 一 个 
输入 上 停机 。 根 据 可 证 性 性 质 2， 如 果 $ BTN. WAAR; WR g 是 可 证 的 ， 则 g 
为 假 。 所 以 算法 D 能 判定 的 真 假 性 。 s 

作为 本 节 的 最 后 一 个 定理 ， 用 递归 定理 明确 地 给 出 CN, 十 ,X) 的 语言 中 的 一 个 句子 ， 
它 为 真 ， 但 却 不 可 证 。 定 理 6. 14 说 明 存 在 这 样 的 句子 ,但 没有 像 现在 所 做 的 这 样 ， 将 它 

SAB KEEA PR DF Junprovable 是 不 可 证 的 。 

证 明 思 路 ”使 用 递归 定理 得 到 自 引 用 ， 构 造 一 个 句子 ， 称 “这 个 句子 是 不 可 证 的 ”。 

证 明 设 S 是 如 下 运行 的 图 灵机 。 

S 二 “对 于 任意 的 输入 : 

1. 由 递归 定理 得 到 它 自 己 的 描述 (S). 

2. 用 引 理 6. 12 构造 句子 y=] cLys oj]。 

3. 在 输入 y 上 运行 定理 6. 13 给 出 的 算法 P. 
4. 如 果 上 一 步 接受 ， 就 接受 。” 

设 Wanprovable 是 算法 S 的 第 二 步 所 描述 的 句子 yw。y HE, SENK S 不 接受 0 (F0 E 
随意 选择 的 )。 

如 果 S 能 找到 Wunprovable 的 一 个 证 明 ，S 就 接受 0， 这 个 句子 也 就 因 之 为 假 。 一 个 假名 
子 是 不 能 被 证 明 的 ， 所 以 这 种 情形 不 可 能 发 生 。 剩 下 的 唯一 的 可 能 性 是 S 不 能 找到 
wunprovable 的 证 明 ， 因 而 S 不 接受 0。 但 我 们 已 宣布 过 dunprovable NH o 8 


6.3 图 灵 可 归 约 性 

第 5 章 引 入 可 归 约 性 概念 ， 其 核心 思想 是 利用 一 个 问题 的 解 来 解 另 一 个 问题 。 如 果 A 
可 归 约 到 B， 且 可 以 找到 B 的 一 个 解 ， 就 能 得 到 A 的 一 个 解 。 随 后 ， 又 描述 了 映射 可 归 约 
性 (mapping reducibility) ， 它 是 可 归 约 性 的 一 个 特殊 形式 。 但 映射 可 归 约 性 是 否 已 经 在 
最 广泛 的 意义 下 完全 刻画 了 可 归 约 性 的 直观 概念 呢 ? 没有 。 

例如 ， 考 虑 两 个 语言 Arw 和 Arm， 直 观 上 ， 它 们 能 够 互相 归 约 ， 因 为 它们 中 任 一 个 问 
题 的 解 都 可 被 用 来 求解 另 一 个 问题 ， 只 要 将 答案 反 过 来 即 可 。 但 是 ，Arw 不 能 映射 可 归 约 
到 Am, AX Arw 是 图 灵 可 识别 的 ， 而 Arw 却 不 是 。 现 在 将 介绍 一 种 更 广义 的 可 归 约 性 ， 
叫 作 图 灵 可 归 约 性 (Turing reducibility) ， 它 更 深刻 地 刻画 了 可 归 约 性 的 直观 概念 。 
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语言 也 的 一 个 论 示 (oracle) 是 一 个 能 够 报告 某 个 串 ww 是 否 为 B 的 成 员 
的 外 部 装置 。 一 个 论 示 图 灵机 Coracle Turing machine) 是 一 种 修改 过 的 图 灵机 ， 它 有 询 
问 一 个 论 示 的 额外 能 力 。 记 ME 为 对 语言 B 有 论 示 的 论 示 图 灵机 。 
我 们 不 关心 论 示 的 内 部 工作 机 制 。 使 用 “ 论 示 ”这 个 术语 就 意味 着 一 种 神奇 的 能 力 ， 
意味 着 将 考虑 不 能 由 普通 算法 判定 的 语言 的 论 示 ， 如 下 面 例 子 所 示 。 
考虑 Arw 的 一 个 论 示 。 带 Arw 的 论 示 的 一 个 论 示 图 灵机 比 普通 的 图 灵机 能 
判定 更 多 的 语言 ， 这 样 的 图 灵机 能 够 判定 AMAR 〈 显 然 成 立 )， 它 只 要 对 输入 询问 它 的 
论 示 即 可 。 它 也 能 判定 Er ， 即 图 灵机 的 空 性 质 检查 问题 ， 用 的 是 下 面 称 为 Tv 的 过 程 : 
Tam 一 “对 于 输入 (M), PM 是 一 个 图 灵机 : 
1. 构造 下 面 图 灵机 N: 
N 一 “对 任意 输入 : 
a. 对 2* 中 的 所 有 上 串 并 行 运 行 M。 
b. WR M 接受 它们 中 的 任何 一 个 串 ， 则 接受 。? 
2. 询问 论 示 以 确定 〈《N,0》 EArwv 是 否 成 立 。 
3. 如 果 论 示 回 答 “ 不 *， 则 接受 ; MRA SH’, MH.” a 
如 果 M 的 语言 不 空 ， 则 六 将 接受 每 个 输入 ， 特 别 地 ， 将 接受 0。 从 而 论 示 将 回答 
“E”, H TAr 将 拒绝 。 相 反 地 ， 如 果 M 的 语言 是 空 的 ， 则 Tam 将 接受 。 所 以 Tom 判定 
ETM 。 我 们 说 Erm 是 相对 于 Arm FIER (decidable relative), MMAR KA AT IA 
约 性 的 定义 。 
语言 A 图 灵 可 归 约 (Turing reducible) 到 B, X A WAT BATHS 
定 的 ， 记 作 A<T B. 
例 6. 17 证 明 Erm 图 灵 可 归 约 到 Ar 。 图 灵 可 归 约 性 满足 可 归 约 性 的 直观 概念 ， 下 面 
定理 证 明之 。 
如 果 A 二 rT B 且 B 是 可 判定 的 ， 则 A 也 是 可 判定 的 。 
证 明 ”如果 B 是 可 判定 的 ， 则 可 以 用 判定 B 的 实际 过 程 来 蔡 换 B 的 论 示 。 这 样 就 用 
判定 A 的 普通 图 灵机 取代 了 判定 A 的 论 示 图 灵机 。 z 
图 灵 可 归 约 性 是 映射 可 归 约 性 的 一 个 推广 。 如 果 AS B, M AST B， 因 为 此 映射 归 
约 可 以 被 用 来 给 出 一 个 相对 于 B 判定 A 的 论 示 图 灵机 。 
A Ar 的 论 示 的 论 示 图 灵机 十 分 强大 ， 它 能 解 许 多 不 能 由 普通 图 灵机 解决 的 问题 。 但 
即使 是 这 样 一 个 强大 的 图 灵机 ， 也 不 能 判定 所 有 语言 (参见 练习 6. 4) 。 


6.4 信息 的 定义 


算法 和 信息 是 计算 机 科学 中 的 基本 概念 。 但 丘 奇 -图 灵 论 题 在 给 出 算法 的 广泛 而 实用 
的 定义 的 时 候 ， 却 没有 关于 信息 的 同等 广泛 的 定义 。 不 同 于 单一 而 广泛 的 定义 ， 使 用 的 是 
多 个 依据 应 用 的 定义 。 在 本 节 中 ， 用 可 计算 性 理论 来 给 出 一 个 定义 信息 的 方法 。 

以 一 个 例子 开始 。 考 虑 下 列 两 个 二 进 制 数 序列 的 信息 量 : 
A=0101010101010101010101010101010101010101 
B=1110010110100011101010000111010011010111 

直观 上 上， 序列 A 包含 较 少 的 信息 ， 因 为 它 只 是 将 01 重复 了 20 次 。 相 比 之 下 ， 序列 B 
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看 起 来 包含 了 更 多 的 信息 。 

上 例 表 明了 将 要 介绍 的 信息 定义 背后 的 思想 。 包 含 在 一 个 对 象 中 的 信息 量 将 被 定义 为 
这 个 对 象 的 最 小 表示 或 描述 的 大 小 。 对 象 的 描述 是 指 这 个 对 象 的 精确 且 无 下 义 的 特征 ， 使 
得 单 从 这 个 描述 就 能 重新 产生 那个 对 象 。 这 样 ， 序 列 A 包含 了 很 少 的 信息 ， 因 为 它 有 一 个 
很 短 的 描述 ， 然 而 ， 序 列 如 看 起 来 包含 了 更 多 的 信息 ， 因 为 它 看 起 来 没有 简明 的 描述 。 

在 确定 对 象 的 信息 量 的 时 候 ， 为 什么 只 考虑 最 短 的 描述 呢 ? 我 们 总 是 可 以 通过 在 摘 述 
中 放置 对 象 的 一 个 副本 的 方式 来 描述 一 个 对 象 ， 比 如 一 个 串 。 用 此 方法 ， 能 以 含 B 的 一 个 
副本 的 一 个 40 位 长 的 表 来 描述 前 面 的 串 召 。 这 种 描述 永远 不 会 比 对 象 本 身 短 ， 也 不 会 告 
诉 我 们 关于 信息 量 的 任何 东西 。 但 是 ,一 个 真 的 较 短 的 描述 蕴涵 着 包含 在 对 象 中 的 信息 可 
以 被 压缩 到 更 小 ， 所 以 信息 量 也 就 不 可 能 更 大 。 因 而 最 短 的 描述 的 大 小 决定 了 信息 量 。 

为 了 将 这 个 直观 思想 形式 化 ， 须 做 一 些 准备 。 首 先 ， 将 注意 力 集中 于 这 样 的 对 象 ， 它 
们 是 由 二 进 制 数 构成 的 串 ， 其 他 对 象 可 以 表示 为 由 二 进 制 数 构成 的 串 ， 所 以 这 个 条 件 并 没 
有 限制 理论 的 范围 。 第 二 ， 我 们 只 考虑 这 样 的 描述 ， 它 们 是 由 二 进 制 数 构成 的 串 。 利 用 这 
些 要 求 ， 可 以 很 容易 地 对 比 对 象 的 长 度 与 它 描述 的 长 度 。 下 市 将 考虑 所 允许 描述 的 类 型 。 


6.4.1 极 小 长 度 的 描述 


许多 类 型 的 描述 语言 可 以 用 来 定义 信息 。 选 择 使 用 什么 样 的 语言 影响 着 定义 的 特征 ， 
我 们 的 描述 语言 是 基于 算法 的 。 

用 算法 来 描述 串 的 方法 之 一 是 : 先 构 造 一 个 图 灵机 ， 使 得 若 它 以 空白 带 开 始 运行 ， 就 
能 打印 出 这 个 串 ; 然后 将 此 图 灵机 本 身 也 表示 成 一 个 串 。 这 样 ， 表 示 图 灵机 的 串 就 是 原来 
那个 串 的 一 个 描述 。 这 个 方法 的 缺点 是 ， 图 灵机 不 能 用 它 的 转换 函数 简明 地 表示 信息 表 。 
表示 一 个 对 位 的 串 也 许 就 要 用 到 个 状态 和 要 有 7 行 的 转换 函数 表 ， 这 将 导致 一 个 相对 我 
们 的 目的 来 说 过 长 的 描述 。 因 此 使 用 下 列 更 简洁 的 描述 语言 。 

用 图 灵机 M 和 它 的 二 进 制 数 的 输入 w 来 描述 二 进 制 数 的 串 工 ， 描 述 的 长 度 是 表示 M 
Mw 的 组 合 长 度 。 对 于 将 多 个 对 象 编码 成 一 个 二 进 制 数 串 (M,w;， 采 用 常用 的 记号 来 记 
这 个 描述 。 但 这 里 必须 格外 注意 编码 操作 ‘“。，…、，， 因 为 产生 的 结果 必须 是 简明 的 。 方 
法 是 : EXE (Mow) 为 Mw, WERK HHA w 简单 连接 到 M 的 二 进 制 编码 的 
后 面 。 除 了 下 一 段 中 叙述 的 微妙 之 处 外 ，M 的 二 进 制 编 码 <M) 可 以 使 用 任何 标准 方法 。 
(在 第 一 遍 阅 读 中 ， 不 要 担心 这 个 微妙 之 处 。 你 可 以 暂且 忽略 下 一 段 和 图 6-3.) 

将 w 连接 到 (M) 的 后 面 来 产生 z 的 一 个 描述 ， 如 果 (CM) 结束 和 w 开始 的 地 方 不 
能 从 这 个 描述 自身 分 辨 出 来 的 话 ， 那 么 将 可 能 会 遇 到 麻烦 。 如 果 这 样 ， 就 可 能 有 多 个 对 擂 
R (Mw 进行 划分 的 方法 ， 这 些 方 法 都 会 产生 语法 上 正确 的 图 灵机 和 一 个 输入 ， 从 而 这 
个 描述 将 是 含糊 的 ， 因 此 也 是 无 效 的 。 用 来 避免 这 个 问题 的 方法 是 : 保证 在 (M)w 中 能 
确定 (M) 和 w 的 分 界 位置 。 做 到 这 点 的 一 种 方法 是 : 将 M) 的 每 一 位 写 两 届 ， 即 将 0 
写成 00， 将 1 写成 11， 再 在 其 后 写 下 01 来 标记 分 界 位 置 。 图 6- 3 说 明了 这 个 思想 ， 此 图 
描绘 了 某 个 串 z 的 描述 (M, w). 

分 界 符 
(M,w)=11001111001100--+-1100 01 01101011…010 


(M) w 


图 6-3 串 z 的 描述 (M, w) 的 格式 示例 
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既然 已 定 下 了 描述 语言 ， 下 面 就 要 定义 一 个 测量 串 的 信息 量 的 度量 。 

设 工 是 二 进 制 数 的 囊 ,，x 的 最 小 描述 (minimal description) (24 
d(x)) 是 最 短 的 串 (Mow), BP: 图 灵机 M 在 输入 w 上 停机 时 ， 工 在 带子 上 上。 如果 有 
多 个 这 样 的 串 存 在 ， 则 在 其 中 选择 字典 序 下 的 第 一 个 串 。z 的 描述 复杂 性 (descriptive 
complexity) 记 为 K(x)， 是 

K(x) =| d(x) | 

eG. K) 是 工 的 最 小 描述 的 长 度 。K(x) 的 定义 是 为 了 刻画 串 zx 中 的 信息 量 
这 个 直观 概念 的 。 接 下 来 ， 建 立 关 于 描述 复杂 性 的 一 些 简 单 结果 。 

3cVzx [K(x)<Iz|+e], 

这 个 定理 称 ， 一 个 串 的 描述 复杂 性 最 多 比 它 的 长 度 多 一 个 固定 的 常量 ， 这 个 常量 是 通 
用 的 ， 即 不 依赖 于 这 个 串 。 

证 明 ”为 证 明 此 和 定理 给 出 的 天 (Cz) 的 上 界 ， 只 需 给 出 一 个 不 长 于 这 个 上 界 的 二 的 描 
述 。z 的 最 小 描述 可 能 比 这 个 描述 更 短 ， 但 不 会 更 长 。 

考虑 串 xz 的 下 列 描 述 。 设 M 是 这 样 一 个 图 录 机 : 它 一 启动 就 停机 。 此 图 灵机 计算 恒 
等 函数 输出 与 输入 是 一 样 的 函数 。z 的 一 个 描述 是 〈《M)?z。 令 c 是 〈M) 的 长 度 ， 就 
可 完成 证 明 。 æ 

定理 6. 21 说 明了 怎么 使 用 图 灵机 的 输入 来 表示 这 样 的 信息 : 在 存储 而 不 是 使 用 此 图 
灵机 的 转换 函数 时 ， 此 信息 要 求 一 个 真正 大 的 描述 。 它 与 我 们 的 直觉 是 一 致 的 ， 即 一 个 串 
包含 的 信息 量 不 可 能 (实质 性 地 ) 多 于 它 的 长 度 。 类 似 地 ， 直 觉 也 告诉 我 们 ， 串 zz 包含 
的 信息 不 会 真 的 多 于 x 所 包含 的 信息 。 下 面 的 定理 验证 了 这 个 事实 。 

JeVx Klass Fel, 

证 明 考虑 下 列 图 灵机 M， 它 要 形 如 (N,w〉 的 输入 ， 其 中 六 是 一 个 图 灵机 ，w 是 
它 的 一 个 输入 。 

M=“XtiTA (N, w), HP N 是 一 个 图 灵机 ，w 是 一 个 串 : 

1. 在 w 上 运行 N 直到 停止 ， 且 产生 输出 串 s。 





2. 输出 串 ss,” 
xX 的 一 个 描述 是 “MD) d(x)。 回 忆 一 下 ,d(x) 是 工 的 最 小 描述 ， 这 个 描述 的 长 度 是 
| <M)| 十 |d(xz)|， 即 为 c 十 K(xz)， 其 中 cc 是 (M) 的 长 度 。 a 


下 面 检 查 串 x Aly 的 连接 zy 的 描述 复杂 性 与 它们 的 单个 复杂 性 间 的 关系 。 定 理 6. 21 
可 能 会 使 我 们 相信 ， 连 接 的 复杂 性 最 多 是 单个 复杂 性 的 和 “加 上 一 个 固定 的 常量 ),， 但 实 
际 上 组 合 两 个 描述 的 代价 是 导致 了 一 个 更 大 的 上 界 ， 如 下 面 的 定理 所 述 。 

4cVaz.y LK(vy)e2RK( (tr) + Ky) +c]. 

证 明 构造 图 灵机 M， 它 将 输入 w 拆 成 两 个 单独 的 描述 。 在 第 二 个 描述 d(y) 出 现 以 
前 ， 第 一 个 描述 diz) 的 所 有 位 都 被 写 两 遍 且 以 01 结束 ， 如 图 6- 3 所 示 。 在 得 到 两 个 描 
述 之 后 ， 它 们 就 开始 运行 ， 得 到 串 z 与 y 及 产生 zy。 

显然 ，zy 的 这 个 描述 的 长 度 是 xz 的 复杂 性 的 两 倍加 上 y HARARE, BOER M 的 
固定 常量 c。 此 和 为 


O ”描述 复杂 性 有 时 也 称 柯 尔 莫 哥 洛 夫 (Kolmogorov) 复杂 性 或 柯 尔 莫 哥 洛 夫 - 伽 廷 (Kolmogorov-Chaitin) 复杂 性 。 


2K(x2) + Ky) +c 

这 就 完成 了 证 明 。 a 

可 以 用 一 个 更 有 效 的 方法 来 指出 两 个 描述 之 间 的 分 离 之 处 ， 从 而 可 以 稍微 改进 这 个 定 
理 。 这 是 一 个 避免 双 写 dix) 的 数位 的 方法 。 用 二 进 制 整数 表示 da) 的 长 度 ， 但 它 已 被 
双 写 ， 使 得 它 不 同 于 d(x)。 这 个 描述 仍然 包含 足够 的 信息 来 对 之 进行 解码 ， 从 而 得 到 x 
Aly 的 描述 。 现 在 ， 它 的 长 度 最 多 为 

2log: (K(Cz)) 十 KCz) 十 KCy) 十 c 
还 可 以 做 一 些 不 大 的 改进 。 但 如 问题 6. 19 所 指出 的 ， 不 能 达到 界 KKO) +c. 


6.4.2 定义 的 优化 


下 面 ， 在 描述 复杂 性 的 初等 性 质 的 基础 上 发 挥 某 些 直觉 ， 来 讨论 此 定义 的 一 些 特点 。 

在 用 算法 来 定义 描述 复杂 性 的 所 有 可 能 的 方法 中 ， 刚 才 关 于 KO 的 定义 具有 一 个 优化 性 
质 。 假 如 将 一 般 的 描述 语言 (description language) 看 作 一 个 可 计算 函数 p:>* >, HENT 
相对 于 p 的 最 小 描述 为 满足 p(s) 二 xz 的 标准 字符 串 顺 序 中 的 第 一 个 串 s， 记 为 dp (x)。 因 
此 ，s 是 xz 最 短 描述 按 字典 序 排列 的 第 一 个 。 定 义 Kp (x) =|dp(ax)|. 

例如 ， 将 一 个 程序 设计 语言 (比如 Python (编码 成 二 进 制 数 )) 看 作 描 述 语言 ， 则 
dPpython(X) 将 是 输出 z 的 最 小 Python 程序 ，Kpython (xX) 将 是 这 个 极 小 程序 的 长 度 。 

下 面 的 定理 说 明 ， 任 何 此 种 类 型 的 描述 语言 都 不 会 明显 地 比 原先 定义 的 图 灵机 和 输入 
语言 更 简洁 。 

CED 对 任何 描述 语言 p， 存 在 一 个 只 与 p 有 关 的 常量 c， 使 得 

Vel Klr) SK (2) Fe] 

证 明 思 路 ”用 Python 例子 来 说 明证 明 思 路 。 假 设 z 有 一 个 短 的 Python 描述 w。 令 M 
是 一 个 能 解释 Python 的 图 灵机 ， 且 以 z 的 Python 程序 wfEnmA. M (Mw) 是 的 
一 个 描述 ， 且 它 比 x 的 Python 描述 只 大 一 个 固定 的 量 。 多 出 的 长 度 是 Python fH Ret M. 

证 明 对 于 输入 语言 p， 考 虑 下 列 图 灵机 M : 


M 二 “对 于 输入 w: 
1. 输出 p(w)。” 
则 <M)4dp (zx) Æ r 的 一 个 描述 ， 它 的 长 度 至 多 比 Ks (x) 大 一 个 固定 常量 ， 此 常量 为 
(M) 的 长 度 。 . 


6.4.3 不 可 压缩 的 串 和 随机 性 


定理 6. 21 证 明了 串 的 最 小 描述 绝 不 会 比 串 本 映 长 太 多 。 对 于 某 些 信息 稀 朴 的 串 ， 它 
们 的 描述 可 能 要 短 得 多 。 是 不 是 某 些 串 没 有 更 短 的 描述 呢 ? 换 名 话说， 是 不 是 某 些 串 的 最 
小 描述 实际 上 和 串 本 身 一 样 长 呢 ? 下 面 将 证 明 这 样 的 串 是 存在 的 。 对 于 这 些 串 ， 简 单 地 将 
它们 写 出 来 就 是 最 简洁 的 描述 。 

设 工 是 一 个 串 ， 如 果 

Kias la|- 

Nk x Hc 可 压缩 的 (ccompressible)。 如 果 工 不 是 c 可 压缩 的 ， 则 称 工 是 不 可 压缩 ce 的 
(incompressible by c) 。 如 果 工 是 不 可 压缩 1 的 ， 则 称 工 是 不 可 压缩 的 (incompressible) 。 
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换言之 ， 如 果 z 有 一 个 比 它 的 长 度 短 c 位 的 描述 ， 则 z 是 c 可 压缩 的 。 否 则 ，z 是 不 
可 压缩 c 的 。 最 后 ， 如 果 工 没有 比 它 本 身 更 短 的 描述 ， 则 xz 是 不 可 压缩 的 。 先 来 证 明 不 可 
压缩 的 串 是 存在 的 ， 然 后 再 讨论 它们 的 一 些 有 意思 的 性 质 。 特 别 地 ， 将 证 明 不 可 压缩 的 串 
看 起 来 就 像 是 随机 抛 硬币 得 到 的 串 。 

EDE 对 于 年 个 长 度 ， 都 存在 不 可 压缩 的 串 。 

证 明 思路 ”长 度 为 n 的 串 的 个 数 比 长 度 小 于 nn 的 描述 的 个 数 要 大 。 每 个 描述 最 多 描述 
一 个 串 。 所 以 某 个 长 度 为 n 的 串 不 能 由 任何 长 度 小 于 的 描述 来 描述 。 这 个 串 就 是 不 可 压 
缩 的 。 

证 明 KEX n 的 二 进 制 数 串 的 个 数 是 2 ， 每 个 描述 都 是 一 个 非 空 的 二 进 制 数 串 ， 故 
长 度 小 于 nn 的 描述 的 个 数 最 多 为 长 度 小 于 等 于 ”一 1 的 串 的 个 数 之 和 ， 即 : 

>，2 一 1 十 2 十 4 十 8 十 … 十 2 呈 = 27-1 


0<i<n—1 
所 以 较 短 描述 的 个 数 小 于 长 度 为 n 的 串 的 个 数 。 因 此 ， 至 少 有 一 个 长 度 为 n 的 串 是 不 可 压 
缩 的 。 @ 

GAED 至少 有 2 一 2 一 +1 十 1 个 长 度 为 n 的 串 是 不 可 压缩 c 的 。 

证 明 在 定理 6. 26 证 明基 础 上 扩展 ， 每 个 c 可 压缩 串 的 描述 的 长 度 至 多 为 n 一 c。 这 
E, RZA 2-1-1 个 描述 会 出 现 。 因 此 ， 长 度 为 n 的 2" 个 串 中 最 多 有 2" “+1 一 1 TR 
有 这 样 的 描述 。 剩 下 的 至 少 2* 一 (27+ —1) 个 串 都 是 不 可 压缩 c 的 。 a 

不 可 压缩 的 串 有 许多 性 质 ， 这 些 性 质 都 是 我 们 硕 望 随 机 选择 串 所 具有 的 。 例 如 ， 可 以 
证 明 : KEX n 的 不 可 压缩 串 大 致 含有 相同 个 数 的 0 和 1。 长 度 为 n 的 串 可 能 含有 连续 为 
0 的 子 串 ， 这 种 子 串 的 最 大 长 度 大 致 为 log2n， 这 些 正如 我 们 希望 在 随机 串 中 发 现 的 那样 。 
证 明 这 样 的 命题 将 把 我 们 带 到 远离 主题 的 组 合 数学 和 概率 论 ， 但 下 面 将 证 明 的 定理 构成 这 
些 命题 的 基础 。 

这 个 定理 表明 ， 对 于 任何 可 计算 性 质 ， 如 果 它 对 “几乎 所 有 ”的 串 都 成 立 ， 则 对 所 有 
足够 长 的 不 可 压缩 串 也 成 立 。 如 0. 2 节 提 到 的 那样 ， 关 于 串 的 一 个 性 质 就 是 一 个 简单 函数 
f， 它 将 串 映射 到 (TRUE, FALSE}, WREKEN n, (HN FALSE 的 串 所 占 的 部 分 在 n 
增 大 时 趋向 于 0， 就 说 一 个 性 质 对 几乎 所 有 串 成 立 。 一 个 计算 性 质 如 果 对 几乎 所 有 的 串 都 
成 立 ， 则 对 随机 选择 的 长 串 也 可 能 成 立 。 因 此 随机 串 和 不 可 压缩 串 都 有 这 样 的 性 质 。 

GEED 设 / 是 一 个 对 几乎 所 有 囊 成 立 的 性 质 ， 则 对 任意 5>0， 性质 了 只 在 有 限 
多 个 不 可 压缩 5b 的 串 上 的 值 是 FALSE。 

证 明 设 M 是 下 列 算法 : 

M 一 “对 于 输入 z， 其 中 是 一 个 二 进 制 整数 

1. 在 标准 字符 串 顺序 下 ， 找 到 使 得 f(s) 二 FALSE WR i TE s. 
2. ay th s” 

可 以 用 M 来 得 到 不 具有 性 质 SBR. FUT: 设 工 是 这 样 的 串 ， 将 所 
有 不 具有 性 质 三 的 串 排 成 一 个 序列 ， 序 列 是 按 字 符 串 顺序 排序 〈 即 ， 按 长 度 排 列 ， 对 同一 
长 度 的 按 字典 序 排列 ) 。 令 irr 在 这 个 序列 中 的 位 置 或 序 标 (index)。 则 (M,iz) Æ f 
的 一 个 描述 。 这 个 描述 的 长 度 为 |zz| 十 <c， 其 中 c 是 〈M) 的 长 度 。 因 为 没有 性 质 f 的 串 较 
少 ， 故 z 的 序 标 是 小 的 ， 它 的 相应 描述 也 是 短 的 。 

任 取 数 O>0, Hen, HE: 在 所 有 长 度 小 于 或 等 于 n 的 串 中 ， 至 多 有 1/2" “1 不 具 
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有 性 质 f/。 所 有 足够 大 的 n 都 满足 这 个 条 件 ， 因 为 了 对 几乎 所 有 的 串 成 立 。 令 工 是 长 度 为 
n 的 没有 性 质 f AER, KENT SF n 的 串 有 2"! 一 1 个 ， 因 此， 


antl] 
i ope 2" 你 一 二 
Mm |iz|\<n—b—c, M (M,iz) 的 长 度 至 多 为 〈?2 一 0 一 c) 十 c 一 2 一 5。 这 意味 着 
K(x) Sb 
这 样 ， 使 得 不 具有 性 质 太 的 每 个 足够 长 的 zz 都 是 可 压缩 2 的。 因此， 只 有 有 限 多 个 不 具有 
性 质 f 的 串 是 不 可 压缩 6b 的 。 证 毕 。 a 


现在 是 展示 一 些 不 可 压缩 串 的 适当 时 候 了 。 但 如 问题 6. 16 所 要 求证 明 的 那样 ， 复 杂 
性 测度 K 是 不 可 计算 的 。 而 且 ， 根 据 问题 6.17， 没 有 算法 能 够 一 般 性 判定 串 是 不 是 不 可 
压缩 的 。 确 实 ， 根 据 问 题 6.18， 它 们 没有 无 限 子 集 是 图 灵 可 识别 的 ， 所 以 没有 办 法 得 到 长 
的 不 可 压缩 串 ， 即 使 有 ， 也 没有 办 法 来 检查 这 个 串 是 不 是 不 可 压缩 的 。 下 面 的 定理 描述 了 
一 些 几 乎 是 不 可 压缩 的 串 ， 但 它 也 没有 提供 明确 的 展示 方法 。 
存在 常量 5， 使 得 对 每 个 囊 zx， 工 的 最 小 描述 d(z) 都 是 不 可 压缩 6 的 。 
证 明 考虑 下 列 图 灵机 ML: 
M= 二 “对 于 输入 《R，y);， 其 中 R 是 一 个 图 灵机 ，y 是 一 个 串 : 
1. 在 y 上 运行 R， 且 在 它 的 输出 不 具有 形式 “S,z〉 时 ， 拒 绝 。 
2. 在 z 上 运行 S$， 且 将 它 的 输出 放 在 带子 上 后 停机 。” 
令 0 为 |〈(M)| 十 1,， 证明 2 满足 本 定理 。 如 不 然 ， 则 对 某 个 串 r, dlr) =n ee 
的 。 从 而 
|d(d(x))|<|d(x)|—b 
但 (M)d(d(x)) 是 zz 的 一 个 描述 ， 它 的 长 度 至 多 为 
| <M) |+|d(d(r)) |<(—1) + (|d(z) |—b) = |d(xz)|—-1 


x 的 这 个 描述 比 d(x) 更 短 。 这 与 后 者 的 最 小 性 矛盾 。 于 
练习 | 
6.1 用 一 个 实际 的 程序 设计 语言 (或 它 的 一 个 合理 的 近似 ) 写 一 个 本 质 上 反映 递归 定理 的 例子 ， 它 
将 其 自身 打印 出 来 。 


6.2 WEH: MINTrx 的 任何 无 限 子 集 都 不 是 图 灵 可 识别 的 。 

A6.3 WH: 如 果 AX<7BA BC, MJ A<rC, 

6.4 i Arm ={(M,w)|ME—*A ii ROL, Mt HEB w). WEH: Aim 相 对 Arm 是 不 可 判定 的 。 
A6.5 命题 3zVy[z 十 y 一 让 是 否 为 ThCN, 十 ) 的 成 员 ? WHA? Iry y[x 十 y= 二 x]」 呢 ? 


6.6 XIRA m>1, Z,={0,1,2,° 一 1) ， 且 令 大 "一 (Z ,十 ,X) 是 如 下 模型 : CHERE Zn, 
它 有 对 应 ee 证 明 : 对 每 个 mm， 理论 Th(F,,) 是 可 判定 的 。 
6.7 ÆR: 对 于 任意 两 个 语言 A 和 B， 存 在 语言 使 得 A 二 tJ 且 BTJ。 
6.8 WH: 对 任意 语言 A， 存 在 语言 B， 使 得 A<rB ABSA. 
"6.9 证明 : 存在 两 个 语言 A 和 B EARAW HN, HBAS BABA. 
*6.10 设 A 和 B 是 两 个 不 交 的 语言 。 如 果 ACC 且 BCC， 则 称 语言 C 分 离 A 和 B。 描 述 两 个 不 交 的 图 
灵 可 识别 语言 ， 使 得 它们 不 可 由 任何 的 可 判定 语言 分 离 。 
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6.11 证 明 EQrm 可 由 一 个 带 Arw 的 论 示 的 图 灵机 识别 。 

6.12 在 推论 4.15 中 ， 我们 证 明了 所 有 语言 构成 的 集合 是 不 可 数 的 。 利 用 这 个 结果 证 明 : 存在 不 可 由 
带 Arw 的 论 示 的 论 示 图 灵机 来 识别 的 语言 。 

6.13 回忆 一 下 5.2 节 定义 的 波斯 特 对 应 问题 及 其 相关 的 语言 PCP。 证 明 PCP 相对 于 Arm AT FI 
定 的 。 

6.14 说 明 怎 么 使 用 Arw 的 论 示 来 计算 串 的 描述 复杂 性 天 (Cz)。 

6.15 使 用 问题 6. 14 的 结论 来 给 出 一 个 相对 于 Arm 的 论 示 是 可 计算 的 函数 f/， 使 得 对 每 一 个 n，f(n) 
是 一 个 长 度 为 n 的 不 可 压缩 串 。 

6.16 证 明 函 数 K(x) 不 是 可 计算 函数 。 

6.17 证 明 不 可 压缩 串 的 集合 是 不 可 判定 的 。 

6.18 证 明 不 可 压缩 串 的 集合 不 包含 无 限 的 图 灵 可 识别 子 集 。 

6.19 WER: 对 任意 c， 存 在 串 zx 和 y， 使 得 K(ry)>K(2)+K(y) +c. 

6.20 设 S=((M)|M 是 一 个 图 灵机 并 且 工 COM)={((M)?))。 证 明 S 和 S 都 不 是 图 灵 可 识别 的 。 

6.21 RON 是 一 个 & 元 关系 。 如 果 可 以 给 出 一 个 带 k& 个 自由 变 元 xz1，… ,zh 的 公式 $$ 使 得 对 所 有 
aisea EN, $ (aista) 只 在 aissa ER 时 为 真 ， 则 称 尺 在 Th(N, 十 ) 中 是 可 定义 的 
(definable) 。 证 明 下 述 每 个 关系 在 Th(N, 十 ) 中 是 可 定义 的 。 

Aa, Ro = {0} 

b. R= <1} 

Ac. R= ={(a,a)|a€N} 

d. Re ={(a,b)|a,bEN FFA a<d} 

6.22 描述 两 个 不 同 的 图 灵机 M 和 N， 使 得 以 任意 输入 开始 时 ，M 输出 N), AN Hirth M). 

6.23 在 递归 定理 的 不 动 点 形式 (定理 6.6) 中 ,， 令 变换 上 是 互 换 图 灵机 描述 中 的 状态 gs 和 eject HF 
到 的 函数 。 给 出 上 的 不 动 点 的 一 个 例子 。 

"6.24 证 明 : EQ <%,EQm. 
A6.25 用 递归 定理 给 出 问题 5. 16 中 赖 斯 定理 的 另 一 种 证 明 。 
^6.26 给 出 下 列 句子 的 一 个 模型 ; 
dea = V «LR (x.x) ] 
A VasxlLRi (2 .yoRi (y,x) | 
A Vasyo2zLCRi (zy) A Ri Cysz)) 一 下 (zyz) J 
6.27 WK $a 如 问题 6.26 所 定义 ， 给 出 下 列 句 子 的 一 个 模型 : 
pir = peq 
A VayLRi(zsy) = 7R2(2,y) J 
A VasyL7Ri (a,y) > (Rs (zx,y) OD R2(y,x)) | 
A VasyezLCR2(xr,y) A RoCysz)) > R, (xr,z) | 
A Vad yLRe(z,y) | 
46.28 ik (N,<) 是 有 论 域 N 和 “小 于 ”关系 的 模型 ， 证明 THON,<) 是 可 判定 的 。 
习题 选 解 
6.3 it MP 判定 A，M8 判定 召 。 用 论 示 图 灵机 M3， 使 得 My 判定 A。 机 器 Ms 模拟 Mi ， 每 次 Mi 向 


它 的 论 示 查询 串 r, HAF Ms 检验 是 否 zxEB 并 将 结果 提供 给 Mi。 因为 Ms 没有 B 的 褒 示 且 不 能 
直接 执行 检验 ， 因 此 它 在 输入 x 上 模拟 Ms 以 获得 那些 信息 。 因 为 机 器 Ms 和 Mo 使 用 相同 的 论 
示 C， 因 此 M; 能 获得 M: 直接 查询 的 结果 。 
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6.5 


6.25 


6. 26 
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MA IY ylety=y] 是 ThCN, 十 ) 的 成 员 ， 因 为 在 论 域 N 上 关于 “十 ”的 标准 解释 下 ， 这 个 命 
题 是 真 的 。 回 忆 我 们 在 本 章 中 令 N=={10,1,2,…},， 故 可 取 z= 二 0。jxVvyLz 十 y= 二 zj 不 是 Th 
(N, 十 ) 的 成 员 ， 因 为 命题 对 这 个 模型 不 再 是 真 的 。 比 如 ，z 取 论 域 中 的 任意 值 ，y 二 1， 都 会 引 
起 x 十 y= 二 =z 为 假 。 
a. Ro 在 Th(N, 十 ) 中 是 可 定义 的 ， 因 为 polr) = V ylr+y=y]. 
c R= 在 Th(N, 十 ) 中 是 可 定义 的 ， 因 为 $= luv) = yY rlo l(t) >rtu=v]. 
用 反 证 法 。 假 设 有 图 灵机 X 判定 性 质 P，P 满足 赖 斯 定理 的 条 件 。 这 些 条 件 中 有 一 条 如 下 : 存在 
图 灵机 A 和 B, 满足 AECPH (B)4P。 用 A 和 B 构造 图 灵机 R: 
R= 二 “在 输入 w 上 : 

1. 使 用 递归 定理 获得 自己 的 描述 〈R)。 

4 上 和 

3. 如 果 X HS (R), 在 w 上 模拟 B。 如 果 XX 拒绝 (R), Æw ERWA.” 

如 果 (REP, 那么 X 接 受 (R) ALCR)=L(B). BÆ (DEP, 5 (HCPFEH, AAP 
和 图 灵机 有 相同 的 语言 。 如 果 《〈R) 代 已 ， 我 们 得 到 一 个 类 似 的 矛盾 。 因 此 ， 我 们 的 初始 假设 是 错 
误 的 ， 每 个 满足 赖 斯 定理 的 条 件 的 性 质 是 不 可 判定 的 。 
命题 gea 用 等 号 关系 给 出 三 个 条 件 。 模 型 (A,R) 是 ga 的 一 个 模型 ， 其 中 A 是 任何 域 ，Ri 是 A 
上 的 等 价 关 系 。 例 如 ，A 是 整数 域 Z，Ri 二 (4(i,i)1i€Z) 就 是 一 个 模型 。 
把 Th(N,<) 归 约 到 ThCN, 十 )， 这 我 们 已 经 证 明 是 可 判定 的 。 证 明 如 何 把 N, < 的 语言 上 的 
句子 加 转换 成 N, +) 的 语言 上 的 句子 $2 ， 当 它们 在 各 上 自 的 模型 中 同时 保持 真 或 假 。 对 册 中 i 一 
j 的 每 个 出 现 ， 用 g 中 的 公式 ARLG+R=j) ACR+RAA)) 代替 ， 这 里 的 & 每 次 都 是 不 同 的 变量 。 

句子 ¢ 与 句子 p 是 相等 的 ， 因 为 “i 小 于 ;7” 意 味 着 我 们 对 i 增加 一 个 非 0 值 就 能 得 到 7。 判 
定 Th(N, 十 〉 的 算法 需要 把 $s 写成 前 束 范 式 ， 需 要 一 点 点 额外 工作 。 新 的 存在 量词 带 到 了 和 句子 的 
前 面 ， 为 此 ， 这 些 量词 必须 穿 过 句子 中 出 现 的 布尔 运算 。 量 词 穿 过 八 和 VV 时 不 改变 ， 而 穿 过 一 时 
3 变 为 yY ，V 变 为 3 。 这 样 一 3 ky 变 成 等 价 的 表达 式 VYk 一 Jy， 一 VY ky 变 成 jk 一 y。 
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如 果 求 解 一 个 问题 需要 过 量 的 计算 资源 (时 间或 存储 量 )， 那 么 即使 它 在 理论 上 是 可 
判定 的 ， 实 际 上 它 仍 然 可 能 是 不 可 解 的 。 本 书 的 最 后 这 一 部 分 介绍 计算 复杂 性 理论 一 一 一 
门 研究 求解 计算 问题 所 需要 的 时 间 、 存 储量 或 者 其 他 资源 的 理论 。 先 从 时 间 开 始 。 

本 章 旨 在 介绍 时 间 复 杂 人 性 理论 的 基础 知识 。 首 先 要 介绍 一 种 度量 求解 问题 时 所 需 时 间 
的 方法 ， 然 后 介绍 怎样 根据 所 需要 的 时 间 来 给 问题 分 类 ， 最 后 讨论 茶 些 可 判定 问题 需要 耗 
费 极 大 量 时 间 的 情况 ， 以 及 当 遇 到 这 样 的 问题 时 该 怎样 识别 它们 。 


7.1 度量 复杂 性 


考察 下 列 例子 。 语 言 A 二 {0*1*|k 宇 0;。 显 然 A 是 一 个 可 判定 的 语言 。 单 带 图 灵机 需 
要 多 少时 间 来 判定 A 呢 ? 考察 下 面 判 定 A 的 单 带 图 灵机 Mi 。 我 们 给 出 该 图 灵机 的 低级 描 
述 ， 包 括 读 写 头 在 带子 上 的 实际 运动 ， 从 而 可 以 计算 出 Mi 运行 时 所 经 过 的 步 数 。 

Mi 二 “对 输入 串 w: 

1. 扫描 带子 ， 如 果 在 1 的 右边 发 现 0， 就 拒绝 。 

2. 如 果 带 子 上 既 有 0 也 有 1， 就 重复 下 一 步 。 

3. 扫 摘 带子， 删除 一 个 0 和 一 个 1。 

4. 如 果 所 有 1 都 被 删除 以 后 还 有 0， 或 者 所 有 0 都 被 删除 以 后 还 有 1， 就 拒绝 。 
否则 ， 如 果 在 带子 上 既 没 有 剩 下 0 也 没有 剩 下 1， 就 接受 。 

我 们 将 分 析 判 定 A 的 图 灵机 Mi 的 算法 所 需 的 时 间 。 对 此 ， 首 先 介 绍 一 些 术 语 和 
Tomes 

在 一 个 特定 的 输入 上 ， 算 法 所 使 用 的 步 数 可 能 与 若干 参数 有 关 。 例 如 ， 如 果 输 入 是 一 
个 图 ， 则 步 数 可 能 依赖 于 图 的 结 点 数 、 边 数 和 最 大 度数 ， 或 者 这 些 因素 的 组 合 ， 或 者 它们 
与 其 他 因素 的 某 种 组 合 。 为 了 简单 起 见 ， 把 算法 的 运行 时 间 纯 粹 作为 表示 输入 字符 串 的 长 
度 的 函数 来 计算 ， 而 不 考虑 其 他 参数 。 在 最 坏 情况 分 析 (worst-case analysis) 中 ， 即 这 里 
考察 的 形式 ， 考 虑 在 某 特定 长 度 的 所 有 输入 上 的 最 长 运行 时 间 。 在 平均 情况 分 析 (aver- 
age-case analysis) 中 ， 考 虑 在 某 特定 长 度 的 所 有 输入 上 的 运行 时 间 的 平均 值 。 

令 M 是 一 个 在 所 有 输入 上 都 停机 的 确定 型 图 灵机 。M 的 运行 时 间 
(running time) 或 者 时 间 复 杂 度 (time complexity) 是 一 个 函数 f:N>N, HPN 是非 负 
KAKRA, fn) 是 MM 在 所 有 长 度 为 nn 的 输入 上 运行 时 所 经 过 的 最 大 步 数 。 若 f(n) 是 
M 的 运行 时 间 ， 则 称 M 在 时 间 fn) 内 运行 ，M 是 fn) 时 间 图 灵机 。 通 常 使 用 nn 表示 
输入 的 长 度 。 


7.1.1 KO 和 小 o 记 法 


因为 算法 的 精确 运行 时 间 通 常 是 一 个 复杂 的 表达 式 ， 所 以 一 般 只 是 估计 它 的 趋势 和 级 
别 。 通 过 一 种 被 称 为 渐 近 分 析 (asymptotic analysis) 的 方便 的 估计 形式 ， 可 以 试图 了 解 
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算法 在 长 输入 上 的 运行 时 间 。 为 此 ， 只 考虑 算法 运行 时 间 的 表达 式 的 最 高 次 项 ， 而 忽略 该 
项 的 系数 和 其 他 低 次 项 ， 因 为 在 长 输入 上 ， 最 高 次 项 的 影响 相 比 其 他 项 占据 主导 地 位 。 

PG, KE f(n)=6n?+2n*+20n+45 有 四 项 ， 最 高 次 项 是 6m3 。 忽 略 系数 6， 称 Sf 
渐 近 地 不 大 于 ?23 。 表 达 这 种 关系 的 渐 近 记 法 (asymptotic notation) RK O 记 法 (big- 
O notation) 是 Fa 一 OG23) 。 在 下 面 的 定义 中 ， 把 这 一 概念 形式 化 。 令 R 是 大 于 0 的 实 
BR 

kf fog ZB BRS, g:N>R*, w f(n) 一 O(g(n))， 若 存在 正 整 数 
c 和 no， 使 得 对 所 有 1 之 720 有 

JRDJSSCcE Cn) 

当 fl(n) 二 Ol(g(n)) 时 ， 称 g(2) 是 f(n) 的 上 界 (upper bound)， 或 更 准确 地 说 ， 
g(n) 是 f(n) 的 渐 近 上 界 (asymptotic upper bound) ， 以 强调 没有 考虑 常数 因子 。 

直观 地 讲 ，f(n) 二 Ol(g(n)) 意味 着 如 果 忽 略 一 个 和 常数 因子 的 差别 ， 那 么 f 将 小 于 或 
者 等 于 g。 可 以 把 O 看 作 代表 一 个 隐藏 的 常数 。 在 实践 中 ， 大 部 分 可 能 碰 到 的 函数 了 都 有 
一 个 明显 的 最 高 次 项 h。 在 这 种 情况 下 ， 写 成 fn) =OCg(n)), KE g 是 不 带 系数 的 h。 

VD i An) 是 函数 523 十 222 十 222 十 6。 保 留 最 高 次 项 On, HASEENWA 
数 5， 得 到 fi (rn) =O). 

验证 一 下 这 个 结果 是 否 满 足 上 面 的 形式 定义 。 为 此 令 c 等 于 6，no 等 于 10， 则 对 于 所 
有 7n 宇 10， 有 5n?+2n? 十 22n 十 6 声 6n3。 

此 外 ， 有 fi(n)=O(n'), AW n’ n 大 ， 所 以 它 也 是 A 的 一 个 渐 近 上 界 。 

BÆ, filn) EFOR), KE c 和 no 赋 什 么 值 ， 始 终 不 能 满足 定义 的 要 求 。 w 
大 口 记 法 名 种 特别 的 方式 与 对 数 相互 影响 通常 写 对 数 时 必须 指明 基数 
(或 称 为 对 数 的 底 )， 如 x 二 log2n。 这 里 基数 2 表明 该 等 式 等 价 于 等 式 27=n. logon 的 值 随 
着 基数 2 的 改变 而 乘 以 相应 的 稼 数 倍 ， 因 为 有 恒等式 logon =logen / log26。 所 以 ， 写 fm) = 
O(logn) 时 不 必 再 指明 基数 ， 因 为 最 终 要 忽略 常数 因子 ，。 

A> faln) FERIA 3nlogzn 十 5nlogzlogzn 十 2。 此 时 有 fo(n) 二 O(nlogn)， 因 为 logn 比 
log logn 更 占 文 配 地 位 。 n 

K O 记 法 也 可 以 出 现在 算术 表达 式 中 ， 如 表达 式 f (nm) =O(n?) +O). HEI FF O 
的 每 一 次 出 现 都 代表 一 个 不 同 的 隐 珊 的 和 常数。 因为 Ol(m*) 相 比 O(n) BAS ACH. AT 
以 该 表达 式 等 价 于 f(r) = 二 Olm? ) 。 当 符号 O 出 现在 如 表达 式 f (nn) 二 20<" 中 的 指数 上 时 ， 
含义 也 一 样 。 该 表达 式 代 表 22 的 一 个 上 界 ， 其 中 c 是 某 个 常数 。 

在 某 些 分 析 中 会 出 现 表达 式 f(n) = 2008. TSK n= 2er 4 n= 20", AWA 
出 20s) 代表 严 的 一 个 上 前。 其 中 上 是 稼 数 。 表 达 式 一 种 方式 代表 了 同样 的 界 ， 
因为 表达 式 OO) 代表 不 超过 某 个 固定 常数 的 值 。 

RANA SHI A, Bc 是 大 于 0 的 和 常数。 这 种 界 称 为 多 项 式 界 (polynomi- 
al bound) 。 形 如 2 的 界 当 5 是 大 于 0 的 实数 时 ， 称 为 指数 界 (exponential bound) 。 

与 大 O 记 法 相伴 的 有 小 o Wik (small-o notation), K O 记 法 指 一 个 函数 渐 近 地 不 大 
于 男 一 个 函数 。 要 说 一 个 函数 渐 近 地 小 于 男 一 个 孔 数 ， 则 用 小 o 记 法 。 大 O 与 小 o 记 法 的 
区 别 类 似 于 三 与 二 之 间 的 区 别 。 

CBORD 设 f 和 pg 是 两 个 函数 /，g:N>R1 。 如 果 
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则 称 f(n)=ol(g(n)),. REZ, f(mM=olg(n)) 意味 着 对 于 任何 实数 c 六 0， 存 在 一 个 数 
no ， 使 得 对 所 有 n 宇 no，f(n) 二 cg(n)。 

容易 验证 下 面 的 等 式 。 

1. Vn =o(n) 

2.n=o(nlog(log n)) 





3. nlog(log n) =o(nlog n) 
4. nlog n=o0(n?) 
5. n2? =o0(n*) 


Bi, fma) FFT olfa). a 


7.1.2 分 析 算 法 


本 小 节 分 析 语 言 A={081*|k>0} 对 应 的 图 灵机 算法 。 为 了 便于 阅读 ， 这 里 重 述 一 遍 
此 算法 。 

Mi = “xt #7 A P Ws 

1. 扫描 带子 ， 如 果 在 1 的 右边 发 现 0， 就 拒绝 。 

2. 如 果 带 子 上 既 有 0 也 有 1， 就 重复 下 一 步 。 

3. 扫描 带子 ;删除 = 个 0 和 一 个 1。 

4. 如 果 删 除 所 有 1 后 还 有 0， 或 者 所 有 0 都 被 删除 以 后 还 有 1， 就 拒绝 。 否 则 ， 
如 果 在 带子 上 既 没 有 剩 下 0 也 没有 剩 下 1]， 就 接受 。” 

为 了 分 析 Mi ， 把 它 的 四 个 步骤 分 开 来 考虑 。 步 又 1 中 ， 机 器 扫描 带子 以 验证 输入 的 
形式 是 0* 1* 。 执 行 这 次 扫描 需要 nn 步 。 如 前 面 约 定 的， 通常 用 n 表示 输入 的 长 度 。 将 读 
写 头 重新 放置 在 带子 的 左 端 男 外 需要 n 步 。 所 以 这 一 步骤 总 共 需 要 2n 步 。 用 大 O 记 法 ， 
称 这 一 阶段 需要 On) 步 。 注 意 ， 在 机 器 描述 中 没有 提 及 重新 放置 读 写 头 的 操作 。 渐 近 记 
法 允许 在 机 器 描述 中 忽略 那些 对 运行 时 间 的 影响 不 超过 和 常数 倍 的 操作 细节 。 

在 步骤 2 和 3 中 ， 机 器 反复 扫描 带子 ， 在 每 一 次 扫描 中 删除 一 个 0 和 一 个 1。 每 一 次 
扫描 需要 O(n) 步 。 因 为 每 一 次 扫描 删除 两 个 符号 ， 所 以 最 多 扫描 n/2 次 。 于 是 步骤 2 和 
3 需要 的 全 部 时 间 是 (n/2)O(n)= 二 O(nm?) 步 。 

在 步骤 4 中 ， 机 器 扫描 一 次 来 决定 是 接受 还 是 拒绝 。 这 一 步 需要 的 时 间 最 多 是 OC). 

所 以 ，Mi 在 长 度 为 n 的 输入 上 总 共 耗 时 为 O(n) 十 Ol?) 十 O(n)， RON), RAZ, 
它 的 运行 时 间 是 O(nw?* ) 。 这 就 完成 了 对 该 机 器 的 时 间 分 析 。 

为 了 根据 时 间 需 求 来 给 语言 分 类 ， 下 面 定义 一 些 记 法 。 

4-t:N>R* 是 一 个 函数 。 定 义 时 间 复 杂 性 类 (time complexity class) 
TIME(t(n)) AWOCn)) 时 间 的 图 灵机 判定 的 所 有 语言 的 集合 。 

回忆 语言 A 二 {0*1*|k 宇 0}。 前 面 的 分 析 表 明 ， 因 为 M 在 时 间 O(n?) 内 判定 A， 而 
TIME?) 包括 所 有 在 时 间 On?) 内 可 以 判定 的 语言 ， 所 以 AC TIME(n?).。 

是 否 存在 渐 近 更 快 地 判定 A 的 机 器 呢 ? 换 言 之 ， 是 否 对 于 某 个 ti(n) 二 on*)，A 属于 
TIME(t(n))? 在 每 一 次 扫描 中 删除 两 个 0 和 两 个 1， 而 不 仅仅 是 各 一 个 ， 就 可 以 减少 运行 


B7F HAAKEH 177 


时 间 ， 因 为 这 么 做 把 扫描 次 数 减少 了 一 半 。 但 是 这 样 只 使 得 运行 时 间 提 高 了 2 倍 ， 不 影响 
MUTI TTA Te], TEALA Mo 采用 不 同 的 方法 ， 可 以 渐 近 更 快 地 判定 A。 它 表明 A € 
TIME(n log n). 

M: = “Xt A P wW: 

| . 扫描 带子 ， 如 果 在 1 的 右边 发 现 0， 就 拒绝 。 

. 只 要 在 带子 上 还 有 0 和 1， 就 重复 下 面 的 步 又。 
. 扫描 带子 ， 检 查 剩余 的 0 和 1 的 总 数 是 偶数 还 是 奇数 。 奉 是 奇数 ， 就 拒绝 。 
. 再 次 扫描 带子 ， 从 第 一 个 0 开始 ， 隔 一 个 删除 一 个 0; 然后 从 第 一 个 1 开始 ， 
隔 一 个 删除 一 个 L, 
5. 如 果 带 子 上 不 再 有 0 和 1， 就 接受 。 否 则 ， 拒 绝 。” 

在 分 析 M: 之 前 ， 先 来 验证 它 的 确 可 以 判定 A。 在 步骤 4 中 ， 每 执行 一 次 扫描 ， 剩 余 
的 0 的 总 数 就 减少 一 半 ， 其 他 的 0 被 删 了 除了。 因此， 如果 开 始 时 有 13 个 0， 那么 在 步骤 4 
执行 一 次 以 后 就 只 剩 下 6 个 0。 随 后 每 次 执行 分 别 剩 下 3 个 、1 个 和 0 个 0。 该 步骤 对 1 的 
数目 有 同样 的 效果 。 

现在 来 检查 在 每 次 执行 步骤 3 时 0 和 1 的 数目 的 奇偶 性 。 再 次 假定 开始 时 有 13 个 0 
和 13 个 1。 第 一 次 执行 步骤 3 时 ， 有 奇数 个 0 〈 因 为 13 是 奇数 ) 和 奇数 个 1， 以 后 每 次 执 
行 时 分 别 只 剩 下 偶数 个 〈6 个 )、 然 后 是 奇数 个 (3 个 ) 、 又 是 奇数 个 (1 个 ) 0 和 1。 由 于 
步骤 2 指定 的 循环 条 件 ， 当 剩 下 0 个 0 或 0 个 1 时 ， 步 又 3 不 再 被 执行 。 对 于 得 到 的 奇偶 
序列 ( 奇 、 偶 、 奇 、 奇 )， 如 果 把 偶 蔡 换 成 0， 把 奇 蔡 换 成 1， 并 且 反 排 这 个 序列 ， 就 得 到 
1101， 即 13， 这 是 开始 时 0 和 1 的 数目 的 二 进 制 表示 。 该 奇偶 序列 总 是 以 反 排 的 方式 给 出 
二 进 制 表示 。 

4PR 3 检查 剩 下 的 0 和 1 的 总 数 是 偶数 时 ， 实 际 上 是 在 检查 0 数目 的 奇偶 性 与 1 数 
目的 奇偶 性 是 否 一 致 。 如 果 这 两 个 奇偶 性 始终 一 致 ， 那 么 0 和 1 的 数目 的 二 进 制 表示 就 一 
致 ， 从 而 这 两 个 数目 就 相等 。 

为 了 分 析 Me 的 运行 时 间 ， 首 先 注 意 ， 每 一 步骤 都 消耗 O(n) 的 时 间 ， 然 后 确定 每 
一 步骤 需要 执行 的 次 数 。 步 又 1 和 5 执行 一 次 ， 共 需要 O(n) 的 时 间 。 步 又 4 在 每 一 次 
执行 时 至 少 删 除 一 半 的 0 和 1， 所 以 至 多 1 十 logz2 次 循环 就 可 以 把 全 部 字符 删除 。 于 是 
步 又 2、3 和 4 总 共 消 耗 时 间 (1 二 logzz)OCz) BI O(nlogn)。M 的 运行 时 间 是 O(n) 十 
O(nlogn) = O(nlogn) 。 

前 面 已 经 证 明 AC TIME(m)， 而 现在 有 更 好 的 界 ， 即 AC TIME(nlogn), XAAR 
在 单 带 图 灵机 上 不 可 能 进一步 改进 。 实 际 上 ， 单 带 图 灵机 在 o(nlogn) 时 间 内 判定 的 语言 
都 是 正则 语言 ， 问 题 7. 20 要 求证 明 这 一 点 。 

如 果 图 灵机 有 第 二 条 带子 ， 就 可 以 在 Oln) 时 间 (也 称 为 线性 时 间 Ciner time)) 内 
判定 语言 A。 下 面 的 双 带 图 灵机 Ms 在 线性 时 间 内 判定 A。 机 器 Ms 的 运行 方式 和 上 面 那 
些 判 定 A 的 机 器 不 同 ， 它 只 是 简单 地 将 所 有 0 复制 到 第 二 条 带子 上 ， 然 后 拿 来 和 1 进行 
匹配 。 

Ms 二 “对 输入 串 w: 

1. 扫描 带子 1， 如 果 在 1 的 右边 发 现 0， 就 拒绝 。 
2. 扫描 带子 1 上 的 0， 直 到 第 一 个 1 时 停止 ， 同 时 把 0 复制 到 带子 2 上 。 
3. 扫描 带子 1 上 的 1 直到 输入 的 末尾 。 每 次 从 带子 1 上 读 到 一 个 1， 就 在 带子 2 
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上 删除 一 个 0， 如 果 在 该 完工 之 前 所 有 的 0 都 被 删除 ， 就 拒绝 。 
4. 如 果 所 有 的 0 都 被 删除 ， 就 接受 。 如 果 还 有 0 剩 下 ， 就 拒绝 。?” 

这 个 机 融 分 析 起 来 很 简单 。 四 个 步骤 的 每 一 步 明 显 地 需要 O(n) 步 ， 所 以 全 部 运行 时 
ll O(n)， 因 而 是 线性 的 。 注 意 ， 这 是 可 能 的 最 好 运行 时 间 ， 因 为 光 是 读 输入 就 需要 
ET 

总 结 一 下 关于 A 的 时 间 复 杂 度 的 结果 ， 即 判定 A 所 需要 的 时 间 。 给 出 一 个 单 带 图 灵 
机 Mi， 能 够 在 时 间 O(n?) 内 判定 A， 而 一 个 更 快 的 单 带 图 灵机 M;， 能 够 在 时 间 
O(nlogn) 内 判定 A。 问 题 7. 20 的 证 明 将 指出 ， 不 存在 更 快 的 单 带 图 灵机 。 随 后 将 给 出 一 
个 双 市 图 灵机 Ms ， 能 够 在 时 间 O(n) 内 判定 A。 因 此 A 在 单 带 图 灵机 上 的 时 间 复 杂 度 是 
O(nlogn)， 在 双 带 图 灵机 上 是 O(n)。 注 意 ，A 的 复杂 度 与 选择 的 计算 模型 有 关 。 

上 面 的 讨论 突出 了 复杂 性 理论 与 可 计算 性 理论 之 间 的 一 个 重大 区 别 。 在 可 计算 性 理论 
中 ， 顾 奇 -图 灵 论 题 断 言 ， 所 有 合理 的 计算 模型 都 是 等 价 的 ， 即 它们 所 判定 的 语言 类 都 是 
相同 的 。 在 复杂 性 理论 中 ， 模 型 的 选择 影响 语言 的 时 间 复 杂 度 ， 如 在 一 个 模型 上 线性 时 间 
内 可 判定 的 语言 在 另 一 个 模型 上 就 不 一 定 是 线性 时 间 内 可 判定 的 。 

在 复杂 性 理论 中 ， 根 据 计 算 问 题 的 时 间 复 杂 度 来 对 问题 分 类 。 但 是 用 哪 种 模型 来 度量 
时 间 呢 ? 同一 个 语言 在 不 同 的 模型 上 可 能 需要 不 同 的 时 间 。 

冬运 的 是 ， 对 于 典型 的 确定 型 模型 ， 时 间 需 求 的 差别 不 是 太 大 。 所 以 ， 只 要 分 类 体系 
对 复杂 性 上 相对 较 小 的 差异 不 是 很 敏感 ， 那 么 对 确定 型 模型 的 选择 就 关系 不 大 。 在 下 面 几 
节 中 ， 将 进一步 讨论 这 一 想法 。 


7. 1.3 模型 间 的 复杂 性 关系 


现在 考察 计算 模型 的 选择 怎样 影响 语言 的 时 间 复 杂 度 。 考 察 三 种 模型 . 单 带 图 灵机 、 
多 带 图 灵机 和 非 确 定型 图 灵机 。 

Btn) H-A BR, tn) >n, MH-Atn) 时 间 的 多 带 图 灵机 都 和 某 
一 个 OC? (n)) 时 间 的 单 带 图 灵机 等 价 。 

证 明 思 路 ”此 定理 的 证 明 思 想 非常 简单 。 回 忆 一 下 ， 定 理 3.8 说 明了 怎样 把 一 个 多 
市 图 灵机 转变 为 一 个 模拟 它 的 单 带 图 灵机 。 分 析 这 种 模拟 ， 确 定 它 需 要 多 少 额外 的 时 
间 。 证 明 模 拟 多 市 机 的 每 一 步 最 多 需要 单 带 机 的 O(i(n)) 步 。 因 此 总 共 需 要 时 间 为 
MPG) i. 

证 明 设 M 是 一 个 在 时 间 i(n) 内 运行 的 & 带 图 灵机 。 构 造 一 个 在 时 间 O Ca) 内 
运行 的 单 带 图 灵机 S. 

HLAS S 模拟 M 运行 ， 正 如 定理 3.8 所 描述 的 那样 。 回 忆 一 下 ，S 用 它 的 一 条 带子 表示 
M 的 所 有 上 条 带子 的 内 容 。 这 些 带 子 连 续 存 放 ，M 的 读 写 头 的 位 置 都 标 在 恰当 的 方 格 上 。 

开始 时 ，S 让 它 的 带子 形成 表示 M 的 所 有 带子 的 格式 ， 然 后 模拟 M 的 步骤 。 为 了 模拟 
M 的 一 步 ，S 扫描 带子 上 的 所 有 信息 ， 确 定 在 M 的 读 写 头 下 的 符号 。 然 后 S 再 次 扫描 带子 ， 
更 新 带子 内 容 和 读 写 头 位 置 。 如 果 M 的 读 写 头 向 右 移动 到 带子 上 以 前 没有 读 到 的 位 置 ， 那 么 
S 必须 增加 分 配给 这 条 带子 的 存储 空间 。 为 此 ， 它 把 自己 的 带子 的 一 部 分 向 右 移动 一 格 。 

现在 来 分 析 这 种 模拟 。 对 于 M 的 每 一 步 ， 机 器 S 两 次 扫描 带子 上 活跃 的 部 分 。 第 一 
次 获取 决定 下 一 步 动 作 所 必需 的 信息 ; 第 二 次 完成 这 一 步 的 动作 ，S 的 带子 上 活跃 部 分 的 





B7FX HAAR 179 


长 度 决定 了 S 扫描 一 次 需要 多 长 时 间 ， 所 以 必须 确定 这 个 长 度 的 上 界 。 为 此 取 M 的 & 条 
带子 上 活跃 部 分 的 长 度 之 和 。 因 为 在 t+(n) 步 中 ， 如 果 M 的 读 写 头 在 每 一 步 都 癌 右 移动 ， 
则 M 用 掉 t《n) 个 带子 方 格 。 独 它 还 癌 左 移 ， 则 不 用 那么 多 ， 所 以 每 一 个 活跃 部 分 的 长 度 
最 多 是 i:(n)。 于 是 S 扫描 一 次 它 的 活跃 部 分 需要 O(t(n)) 步 。 

模拟 M 的 每 一 步 ，S 执行 两 次 扫描 ， 还 可 能 最 多 疝 右 移动 次。 每 一 次 用 时 
Olt(n))， 所 以 ， 模拟 M 的 一 步 操 作 ，S 总 共 耗 时 O(t(n))。 

现在 来 界定 模拟 所 需要 的 全 部 时 间 。 在 开始 阶段 ，S 让 它 的 带子 形成 恰当 的 格 
式 ， 这 需要 O(n) 步 。 随 后 ，S 模拟 M 的 it(n) 步 操作 ， 每 模拟 一 步 需 要 O(i(n)) 
步 ， 所 以 模拟 部 分 需要 i(n) XO(i(n))= 二 O(t2(n)) 步 。 因 此 ， 整 个 M 的 模拟 过 程 需 要 
O(n) +O? (n)) 步 。 

假定 tnn (这 是 合理 的 假定 ， 因 为 如 果 时 间 更 少 ，M 连 输入 都 读 不 完 )， 则 S 的 
运行 时 间 是 O(zt?(n))， 证 毕 。 加 

下 面 考察 对 非 确定 型 单 带 图 灵机 的 类 似 定 理 。 证 明 这 种 机 器 所 判定 的 语言 在 确定 型 单 
带 图 灵机 上 也 是 可 判定 的 ， 但 需要 更 多 的 时 间 。 在 此 之 前 ， 必 须 定义 非 确 定型 图 灵机 的 运 
行 时 间 。 回 忆 一 下 ， 一 个 非 确 定型 图 灵机 当 它 的 所 有 计算 分 文 在 所 有 输入 上 都 停机 时 ， 成 
为 一 个 判定 机 。 

设 N 是 一 个 非 确定 型 图 灵机 ， 并 且 是 个 判定 机 。NN 的 运行 时 间 (running 
time) 是 函数 f:N>N, # F fn) 是 在 任何 长 度 为 n 的 输入 上 所 有 计算 分 支 中 的 最 大 步 
数 ， 如 图 7- 1 所 示 。 


à 确定 型 非 确 定型 7 
” 接受 


| = -拒绝 | 


图 7-1 测量 确定 型 和 非 确定 型 时 间 


非 确定 型 图 灵机 运行 时 间 的 定义 不 是 用 来 对 应 任何 实际 的 计算 设备 的 。 相 反 ， 稍 后 将 
说 明 ， 它 是 一 个 有 用 的 数学 定义 ， 有 助 于 刻画 一 类 重要 的 计算 问题 的 复杂 性 。 

CWA) 设 i(n) 是 一 个 函数 ，t(n) 宇 n。 则 每 一 个 t:(n) 时 间 的 非 确定 型 单 带 图 
灵机 都 与 某 一 个 20.:()) 时 间 的 确定 型 单 带 图 灵机 等 价 。 

WEAR 设 N 是 一 个 在 时 间 上 (2z) 内 运行 的 非 确定 型 图 灵机 ， 同 定理 3. 10 的 证 明 一 样 ， 
构造 确定 型 图 灵机 D，D 通过 搜索 N 的 非 确定 型 计算 树 来 模拟 N 。 现 在 分 析 这 种 模拟 。 

在 长 度 为 n 的 输入 上 ，NN 的 非 确定 型 计算 树 的 每 一 个 分 支 的 长 度 最 多 是 1:(n)， 树 的 每 
一 个 结 点 最 多 有 5 个 子女 ， 其 中 6b 是 NN 的 转移 函数 所 决定 的 合法 选择 的 最 大 值 。 因 此 树叶 
的 总 数 最 多 是 b”, 

模拟 过 程 以 宽度 优先 法 探查 这 棵 树 。 换 言 之 ， 在 访问 深度 为 d 十 1 的 结 点 之 前 ， 
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先 访问 所 有 深度 为 a 的 结 点 。 定 理 3. 10 的 证 明 中 给 出 的 算法 当 访 问 某 个 结 点 时 ， 就 
从 根 出 发 下 行 到 那个 结 点 。 这 种 做 法 效率 很 低 ， 但 即使 改进 这 种 低 效 率 也 不 会 使 当前 
定理 发 生 改 变 ， 所 以 不 用 改进 它 。 树 中 结 点 的 总 数 小 于 最 大 叶 数 的 两 倍 ， 因 此 用 
Oe) aE Le. 从 根 出 发 下 行 到 一 个 结 点 的 时 间 是 O(t(n))。 因 此 ，D 的 运 

行 时 间 是 OC tn) OY ) = 200m) 。 

正如 定理 3. 10 中 所 描述 的 ， 图 灵机 D 有 三 条 带子 。 按 照 定理 7.8， 把 它 转变 为 单 市 
图 灵机 最 多 使 运行 时 间 乘 方 。 这 样 ， 单 带 模 拟 机 的 运行 时 间 是 (2% )? = 20w) 一 
20m) ， 定 理 得 证 。 i 


7.2 P% 


定理 7.8 和 定理 7.10 显示 出 一 个 重要 的 差别 。 一 方面 ， 问 题 的 时 间 复 杂 度 在 确定 型 
单 带 和 多 带 图 灵机 上 最 多 是 平方 或 多 项 式 的 差异 ; 男 一 方面 ， 在 确定 型 和 非 确 定型 图 灵机 
上 ， 问 题 的 时 间 复 杂 度 最 多 是 指数 的 差异 。 


7.2.1 多 项 式 时 间 


运行 时 间 的 多 项 式 差异 可 以 认为 是 较 小 的 ， 而 指数 差异 则 被 认为 是 大 的 。 看 一 下 为 什 
么 要 选择 区 分 多 项 式 和 指数 ， 而 不 是 选择 别 的 某 两 类 函数 。 

首先 ， 注 意 到 典型 的 多 项 式 Gn) 与 典型 的 指数 (如 2) 在 增长 率 上 存在 巨大 的 
差异 。 例 如 ， $ nn 是 1000， 这 是 一 个 算法 输入 的 合理 规模 。 在 这 种 情况 下 ，m? 是 10 亿 ， 
虽然 是 大 数 ， 但 还 可 以 处 理 。 然 而 ，2” 则 是 一 个 比 宇宙 中 的 原子 数 还 大 得 多 的 数 。 多 项 式 
时 间 算 法 就 很 多 目的 而 言 是 足够 快 了 ， 而 指数 时 间 算 法 则 很 少 使 用 。 

典型 的 指数 时 间 算 法 来 源 于 通过 搜索 解 空间 来 求解 问题 ， 这 称 为 谈 力 搜索 (brute- 
force search)。 例 如 ， 分 解 一 个 数 为 素数 因子 的 一 种 方法 是 搜 壳 所 有 可 能 的 因子 。 搜 索 空 
间 的 规模 是 指数 的 ， 所 以 这 种 搜索 需要 指数 时 间 。 有 时 候 ， 通 过 更 深入 地 理解 问题 ， 可 以 
避免 蛮 力 搜索 ， 从 而 可 能 会 找到 更 实用 的 多 项 式 时 间 算 法 。 

所 有 合理 的 确定 型 计算 模型 都 是 多 项 式 等 价 的 《polynomially equivalent), ， 也 就 是 说 ， 
它们 中 任何 一 个 模型 都 可 以 模拟 另 一 个 ， 而 运行 时 间 只 增长 多 项 式 倍 。 当 称 所 有 合理 的 确 
定型 模型 都 多 项 式 等 价 时 ， 我 们 并 不 是 想 定 义 什么 是 合理 的 。 但 是 在 心里 有 一 个 概念 ， 它 
足够 广泛 ， 能 容纳 那些 和 实际 计算 机 运行 时 间 近 似 的 模型 。 例 如 ， 和 定理 7. 8 表明 确定 型 单 
带 和 多 带 图 灵机 模型 是 多 项 式 等 价 的 。 

从 现在 起 ， 我 们 关注 时 间 复 杂 性 理论 中 不 受 运 行 时 间 仅 有 多 项 式 差异 影响 的 方面 。 忽 
略 这 样 的 差异 让 我 们 可 以 不 依赖 于 选择 具体 计算 模型 来 研究 理论 。 记 住 ， 我 们 的 目标 是 给 
出 计算 的 基本 性 质 ， 而 不 是 图 灵机 或 其 他 特殊 模型 的 性 质 。 

读者 可 能 感到 忽略 运行 时 间 的 多 项 式 差 异 是 荒 雇 的。 实际 上 上， 程序 员 当然 在 乎 这 种 差 
异 ， 而 且 他 们 拼命 干 就 是 为 了 能 让 程序 运行 快 两 倍 。 但 是 ， 前 面 介 绍 渐 近 记 法 的 时 候 ， 忽 
略 了 常数 因子 。 现 在 又 建议 忽略 比 这 大 得 多 的 多 项 式 差 异 ， 如 时 间 n 和 nm? 这 样 的 差异 。 

决定 忽略 多 项 式 差异 并 不 是 说 这 样 的 差异 不 重要 ， 相 反 ， 时 间 n An? 之 间 的 差异 是 
重要 的 。 但 是 某 些 问题 〈 如 因数 分 解 问题 ) 是 多 项 式 的 还 是 非 多 项 式 的 确实 与 多 项 式 差 寞 
无 关 ， 而 且 这 些 问题 也 很 重要 。 在 这 里 仅仅 关注 这 种 类 型 的 问题 。 撤 开 树 看 森林 并 不 意味 
着 一 样 比 男 一 样 更 重要 一 一 它 只 是 提供 一 种 不 同 的 视角 。 
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现在 给 出 复杂 性 理论 中 的 一 个 重要 定义 。 
TEED P 是 确定 型 单 带 图 灵机 在 多 项 式 时 间 内 可 判定 的 语言 类 。 换 言 之 ， 
P= UTIME(n") 

在 理论 中 ，P 类 扮演 核心 的 角色 ， 它 的 重要 性 在 于 : 

1. 对 于 所 有 与 确定 型 单 带 图 灵机 多 项 式 等 价 的 计算 模型 来 说 ，P 是 不 变 的 。 

2. P 大 致 对 应 于 在 计算 机 上 实际 可 解 的 那 一 类 问题 。 

第 1 条 表明 ， 在 数学 上 ，P 是 一 个 稳健 的 类 ， 它 不 受 所 采用 的 具体 计算 模型 的 影响 。 

第 2 条 表明 ， 从 实用 的 观点 看 ，P 是 恰当 的 。 当 一 个 问题 在 P 中 的 时 候 ， 就 有 办 法 在 
时 间 nt k 是 常数 ) 内 求解 它 。 至 于 这 么 长 时 间 是 否 实 用 就 依赖 于 和 实际 的 应 用 情况 。 
当然 ，zao 的 运行 时 间 不 太 可 能 有 任何 实际 应 用 。 不 管 怎样 ， 把 多 项 式 时 间作 为 实际 可 和 解 
性 的 标准 已 经 被 证 明 是 有 用 的 。 一 旦 为 某 个 原先 似乎 需要 指数 时 间 的 问题 找到 了 多 项 式 时 
间 算 法 ， 则 一 定 是 了 解 了 它 的 某 些 关键 的 方面 ， 通 常 就 能 进一步 降低 它 的 复杂 性 ， 达 到 实 
用 的 程度 。 


7.2.2 P 中 的 问题 举例 


当 给 出 多 项 式 时 间 算 法 的 时 候 ， 给 出 的 是 算法 的 高 层 描述 ， 没 有 提 及 具体 计算 模型 的 
特点 。 这 样 做 回避 了 带子 和 读 写 头 运 动 的 烦琐 细节 。 在 描述 算法 的 时 候 ， 需 遵从 一 定 的 习 
惯 ， 以 便 可 以 分 析 它 的 多 项 式 性 。 

我 们 继续 把 算法 描述 成 带 编号 的 步骤 。 在 图 灵机 上 实现 算法 的 一 个 步骤 通常 需要 图 灵 
机 的 许多 步 。 因 此 ， 我 们 必须 敏感 于 图 灵机 实现 算法 每 一 步 的 步 数 和 算法 的 步骤 总 数 。 

当 分 析 一 个 算法 ， 证 明 它 在 多 项 式 时 间 内 运行 时 ， 需 要 做 两 件 事 。 首 先 ， 必 须 为 算法 
在 长 为 n 的 输入 上 运行 时 所 需要 的 步骤 数 给 出 多 项 式 上 界 (一 般 用 大 O 记 法 )。 其 次 ， 必 
须 考察 算法 描述 中 的 每 一 步 ， 保 证 它们 都 可 以 由 合理 的 确定 型 模型 在 多 项 式 时 间 内 实现 。 
在 描述 算法 时 ， 人 和 仔细 确定 它 的 步骤 ， 以 使 第 二 部 分 分 析 容 易 进行 。 当 两 部 分 工作 都 完成 以 
后 ， 就 可 以 下 结论 : 算法 在 多 项 式 时 间 内 运行 。 因 为 已 经 证 明 它 需要 多 项 式 个 步骤 ， 所 以 
每 一 步 又 可 以 在 多 项 式 时 间 内 完成 ， 而 多 项 式 的 组 合 还 是 多 项 式 。 

需要 注意 的 是 问题 所 用 的 编码 方法 。 我 们 继续 采用 括号 记 法 “。〉 来 指出 把 一 个 或 多 
个 对 象 变 成 字符 串 的 合理 编码 ， 而 不 规定 任何 具体 的 编码 方法 。 现 在 ， 合 理 的 方法 就 是 允 
许 在 多 项 式 时 间 内 把 对 象 编码 /解码 为 自然 的 内 部 表示 或 其 他 合理 的 编码 。 对 于 图 、 自 动 
机 及 类 似 事 物 的 熟知 的 编码 方法 都 是 合理 的 。 但 请 注意 ， 编 码 数字 的 一 进 制 记 法 (如 数字 
17 编码 为 一 进 制 字符 串 11111111111111111) 是 不 合理 的 ， 因 为 它 比 真正 合理 的 编码 (如 
以 任何 & 之 2 为 基 的 记 法 ) 大 指数 倍 。 

本 章 碰 到 的 许多 计算 问题 都 包含 图 的 编码 。 图 的 一 种 合理 编码 是 它 的 结 点 和 边 的 列 
表 ， 男 一 种 是 相 邻 矩阵 (adjacency matrix), HPAMA Ai BAR AW. WE (i,j) 
项 为 1， 否则 为 0。 当 分 析 图 上 的 算法 时 ， 运 行 时 间 可 能 会 根据 结 点 数 而 不 是 表示 图 的 大 
小 来 计算 。 在 合理 的 图 表示 方法 中 ， 表 示 的 大 小 是 结 点 数 的 多 项 式 。 因 此 ， 如 果 分 析 某 个 
算法 ， 并 证 明 它 的 运行 时 间 是 结 点 数 的 多 项 式 (或 指数 )， 那 么 就 知道 它 是 输入 长 度 的 多 
项 式 (或 指数 ) 了 。 

第 一 个 问题 与 有 向 图 有 关 。 有 向 图 G 包含 结 点 s 和 +， 如 图 7-2 所 示 。PATH 问题 就 
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是 要 确定 是 否 存 在 从 s 到 t 的 有 向 路 径 。 令 
PATH={(G,s,t)| G 是 具有 从 s 到 t 的 有 向 路 径 的 有 向 图 } 


图 7-2 PATH 问题 ,存在 从 ;到 + 的 路 径 吗 


PATHEP. 
证 明 思 路 ”通过 给 出 判定 PATH 的 多 项 式 时 间 算 法 来 证 明 该 定理 。 在 描述 算法 之 前 ， 
要 注意 到 该 问题 的 蛮 力 算法 是 不 够 快 的 。 
PATH 的 蛮 力 算法 通过 考察 G 中 所 有 可 能 的 路 径 来 确定 是 否 存 在 从 s 到 上 的 有 回路 
径 。 一 条 可 能 路 径 就 是 G 中 长 度 最 多 为 m 的 结 点 序列 ，m 是 G 中 的 结 点 数 。( 如 果 从 s 到 
t 存在 有 问 路 人 径 ， 那 么 就 存在 长 度 不 超过 m 的 有 向 路 径 ， 因 为 路 径 上 不 需要 重复 结 点 。) 
但 是 这 些 可 能 的 路 径 数 是 m”™， 这 是 G 中 结 点 数 的 指数 倍 。 因 此 该 蛮 力 算法 消耗 指数 时 间 。 
为 了 获得 PATH 的 多 项 式 时 间 算 法 ， 必 须 设法 避免 蛮 力 搜索 。 一 种 办 法 是 采用 图 搜 
索 方法 ， 如 宽度 优先 搜索 。 连 续 标 记 G 中 从 s HR, KEAI, 2, 3, He m WA NKRI 
可 达 的 所 有 结 点 。 用 多 项 式 可 以 容易 地 界定 该 策略 的 运行 时 间 。 
证 明 PATH 的 一 个 多 项 式 时 间 算 法 M 运行 如 下 : 
M= 对 输入 (G,s,t), 是 包含 结 点 s 和 上 上 的 有 问 图 : 
1. 在 结 点 ;上 做 标记 。 
2. 复 重 下 面 步骤 3， 直到 不 再 有 结 点 被 标记 。 
3. 扫描 G 的 所 有 边 。 如 果 找 到 一 条 边 (a,b), a 被 标记 而 2 没有 被 标记 ， 和 那么 标 
ic b. 
4. 在 上 被 标记 ， 则 接受 ; Ail, 24.” 
分 析 该 算法 ， 证 明 它 在 多 项 式 时 间 内 运行 。 显 然 ， 步 又 1 和 4 只 执行 一 次 。 步 又 3 最 
多 执行 m 次 ， 因 为 除 最 后 一 次 外 ， 每 一 次 执行 都 要 标记 G 中 的 一 个 未 标记 的 结 点 。 所 以 
用 到 的 总 步骤 数 最 多 是 1 十 1 十 m， 是 G 的 规模 的 多 项 式 。 
M 的 步骤 1 和 4 很 容易 用 任何 合理 的 确定 型 模型 在 多 项 式 时 间 内 实现 。 步 又 3 需要 扫 
描 输 入 ， 检 查 某 些 结 点 是 否 被 标记 ， 这 也 容易 在 多 项 式 时 间 内 实现 。 所 以 M Æ PATH 的 
多 项 式 时 间 算 法 。 a 
看 另 一 个 多 项 式 时 间 算 法 的 例子 。 称 两 个 数 是 互 素 的 (relatively prime), 41 是 能 同 
时 整除 它们 的 最 大 整数 。 例 如 ，10 和 21 是 互 素 的 ， 虽 然 它们 自己 都 不 是 素数 。 但 是 10 和 
22 不 是 互 素 的 ， 因 为 它们 都 能 被 2 整除 。 令 RELPRIME 代表 检查 两 个 数 是 否 互 素 的 问 
题 ， 即 
RELPRIME= {(z,y)|z2 5 y 2%} 


RELPRIMEE P. 
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证 明 思 路 ”解决 该 问题 的 一 种 算法 是 搜 遍 这 两 个 数 的 所 有 可 能 的 公 因 子 ， 如 果 没 有 发 
现 大 于 1 的 公 因 子 ， 就 接受 。 然 而 ， 用 二 进 制 或 其 他 任何 以 & 为 基 的 记 法 (k 宇 2) 表示 的 
数字 的 大 小 是 它 表 示 长 度 的 指数 倍 。 因 此 该 蛮 力 算法 需要 搜 遍 指数 多 个 可 能 的 因 了 于 ， 消 耗 
指数 的 运行 时 间 。 

我 们 改 用 一 种 古老 的 数值 过 程 来 求解 该 问题 ， 称 为 欧 几 里 得 算法 (Euclidean algorithm), 
以 此 计算 最 大 公 因 子 。 两 个 自然 数 zx 和 y 的 最 大 公 因 子 (greatest common divisor) 记 为 ged 
(z,y)， 是 能 同时 整除 z My 的 最 大 整数 。 例 如 gcd(18,24) 王 6。 显 然 ，z My 是 互 素 的 充 
分 必要 条 件 是 gcdCz,y) 王 1。 在 证 明 中 把 欧 几 里 得 算法 描述 为 算法 E, CEA wR mod, 
x mod y 等 于 用 yy 去 整除 zx 所 得 的 余数 。 

证 明 欧 几 里 得 算法 如 下 : 

E=“xXtH A (ry), cA y 是 二 进 制 表示 的 自然 数 : 

1. 重复 下 面 的 操作 ， 直 到 y= 二 0。 
2 赋值 r-r mod y. 
3- 交换 x Aly 的 值 。 
4. 输出 x.” 
算法 RUE 为 子 程序 求解 RELPRIME. 
R=“ C, y), x 和 yy 是 二 进 制 表示 的 自然 数 : 
LÆ (xz, V LETE. 
2. GARA 1, MHS; 否则 ， 就 拒绝 。” 

显然 ， 阁 玉 在 多 项 式 时 间 内 运行 且 正 确 ， 则 R 也 在 多 项 式 时 间 内 运行 且 正 确 。 所 以 
只 需 分 析 E 的 时 间 和 正确 性 。 该 算法 的 正确 性 是 众所周知 的 ， 不 在 这 里 进一步 讨论 它 。 

为 了 分 析 五 的 时 间 复 杂 度 ， 首 先 证 明 步 又 2 的 每 一 次 执行 〈 除 了 第 一 次 有 可 能 例外 ) 
都 把 r 的 值 至 少 减 少 一 半 。 执 行 步骤 2 以 后 ， 由 函数 mod 的 性 质 知 <y. SRI, A 
Zz>>y， 因 为 这 两 个 值 已 经 交换 。 于 是 当 步 又 2 随后 执行 时 有 x 二 y。 夺 xX/2 宇 y， 则 x mod 
y<ySz/2, z EDRI E., Gx/2<y, Wx mod y=x—y<2/2, x 至 少 减 少 一 半 。 

每 一 次 执行 步骤 3 都 使 x 和 y 的 值 相互 交换 ， 所 以 每 两 次 循环 就 使 得 zx 和 原先 的 值 
至 少 减 少 一 半 。 于 是 步骤 2 和 3 执行 的 最 大 次 数 是 2logzx 和 2logzy 中 较 小 的 那 一 个 。 这 
两 个 对 数 与 表示 的 长 度 成 正比 ， 步 又 的 执行 次 数 是 O(n)。E 的 每 一 步 仅 消耗 多 项 式 时 间 ， 
所 以 整个 运行 时 间 是 多 项 式 的 。 B 

最 后 一 个 多 项 式 时 间 算 法 的 例子 表明 ， 每 一 个 上 下 文 无 关 语 言 是 多 项 式 时 间 可 判定 的 。 

每 一 个 上 下 文 无 关 语 言 都 是 忆 的 成 员 。 

证 明 思 路 ”定理 4. 8 证 明了 每 一 个 CFL 都 是 可 判定 的 ， 并 且 为 每 一 个 CFL BH S Fl 
定 算法 。 如 果 那 个 算法 在 多 项 式 时 间 内 运行 ， 那 么 本 定理 作为 推论 就 必然 成 立 。 回 忆 一 下 
那个 算法 ， 看 它 运行 得 是 否 够 快 。 

& L 是 一 个 由 CFG G 产生 的 CFL，G 是 乔 姆 斯 基 范 式 。 由 问题 2. 38 知 : 因 G 是 乔 姆 
斯 基 范 式 ， 故 任何 得 到 字符 串 w 的 推导 都 有 2n 一 1 F, nEw 的 长 度 。 当 给 工 的 判定 机 
输入 长 为 n 的 字符 串 时 ， 它 通过 试 遍 所 有 可 能 的 2n 一 1 步 推导 来 判定 工 。 如 果 其 中 有 一 个 
得 到 w 的 推导 ， 该 判定 机 就 接受 ; 否则 ， 就 拒绝 。 

分 析 一 下 该 算法 可 知 ， 它 不 能 在 多 项 式 时 间 内 运行 。& 步 推导 的 数量 可 能 达到 & 的 指 


数 ， 所 以 该 算法 可 能 需要 指数 时 间 。 

为 了 获得 多 项 式 时 间 算 法 ， 在 此 介绍 一 种 强 有 力 的 技术 ， 称 为 动态 规划 Cdynamic 
programming) 。 这 种 技术 通过 累积 小 的 子 问题 的 信息 来 解决 大 的 问题 。 把 子 问题 的 解 都 记 
录 下 来 ， 这 样 就 只 需 对 它 求 解 一 次 。 为 此 ， 把 所 有 子 问 题 编 成 一 张 表 ， 当 碰 到 它们 时 ， 把 
它们 的 解 系统 地 填 人 表格 。 

在 本 例 中 ， 考 虑 G 的 每 一 个 变 元 是 否 产 生 w 的 每 一 个 子 串 这 样 的 子 问题 。 算 法 把 子 
问题 的 解 填 人 一 张 n Xn 表格 。 对 于 iS, RNB Gj) 项 包含 产生 子 串 wiwi+1"…wj 的 
HAET. >j 的 表 项 没有 使 用 。 

算法 为 w 的 每 一 子 串 填写 表 项 。 首 先 为 长 为 1 的 子 串 填写 表 项 ， 然 后 是 长 为 2 的 子 
串 ， 依 此 类 推 。 它 利用 短 子 串 的 表 项 内 容 来 辅助 确定 长 子 串 的 表 项 内 容 。 

例如 ， 假 定 该 算法 已 经 确定 了 由 哪些 变 元 产生 所 有 长 度 不 超过 上 & 的 子 串 。 为 了 确定 变 
元 A 是否 产生 某 一 长 为 & 十 1 的 子 串 ， 算 法 把 该 子 串 以 & 种 可 能 方式 分 裂 为 非 空 的 两 段 。 
对 于 每 一 种 分 裂 方式 ， 算 法 考察 每 一 条 规则 A 一 BC， 利 用 以 前 计算 的 表 项 来 确定 是 否 B 
产生 第 一 段 而 且 C 产生 第 二 段 。 如 果 BAC 都 产生 各 自 的 段 ， 那 么 A 就 产生 该 子 串 ， 并 
且 被 加 入 相关 联 的 表 项 。 算 法 从 长 为 1 的 串 开 始 ， 对 规则 A 一 b 考察 表格 。 

证 明 下 面 的 算法 D 实现 了 这 一 证 明 思 路 。 令 G 是 产生 CFL 工 的 乔 姆 斯 基 范 式 的 
CFG, Bit S 是 起 始 变 元 。( 回 忆 一 下 ， 空 串 在 乔 姆 斯 基 范 式 文 法 中 被 特殊 处 理 。 算 法 在 
步骤 1 中 处 理 w=e 的 特殊 情况 。) 注释 与 在 方 括号 中 。 

万 一 “对 输入 w= wien: 

l. 知 w=s 且 Se 是 一 条 规则 ， 则 接受 。 否 则 拒绝 。 Lw=e 的 情况 ] 
2. X i=l; [考察 每 一 长 为 LNT HI 
3. HEENA, 

4 检查 A 一 b 是 否 是 一 条 规则 ， 其 中 bwi. 

5. fitz, FEA BA table(i,i). 

6 

7 

8 

9 


对 /一 2 一 7; [2 是 子 串 的 长 度 ] 
对 i=1l~n—/41: Li 是 子 串 的 起 始 位 置 ] 
令 1 一 ;十 /一 1。 Lj 是 子 串 的 结束 位 置 ] 
Xt k=i~j— 1: [k 是 分 裂 位 置 ] 
lü. 对 每 一 条 规则 A 一 BC: 
IL 若 table(i,k) BE B H table(k+1,j) 包含 C， 则 把 A BA tablei, j). 


12. Æ S fEtable(1,n) 中 ， 则 接受 ; AM, 4%.” 
现在 分 析 D。 每 一 步 很 容易 在 多 项 式 时 间 内 运行 。 步 骤 4 和 5 RAW nuk, HP v 
是 G 中 的 变 元 数 ， 是 与 n 无 关 的 固定 常数 ;因此 这 两 步 运行 O(n) K. HR 6 最 多 运行 n 
次 。 步 又 6 每 运行 一 次 ， 步 又 7 最 多 运行 nn 次。 步骤 7 每 运行 一 次 ， 步 又 8 和 9 最 多 运行 
nik. GR 9 每 运行 一 次 ， 步 又 10 运行 > 次 ， 这 里 > 是 G 的 规则 数 ， 是 另 一 个 固定 常数 。 
所 以 步骤 11 〈 即 该 算法 的 内 层 循 环 ) wT OG) km. Bit DATO!) 步 。 £ 


7.3 NP 类 


如 7. 2 节 所 揭示 的 ， 许 多 问题 可 以 避免 蛮 力 搜索 而 获得 多 项 式 时 间 解 法 。 但 是 ， 在 某 
些 其 他 问题 (包括 许多 有 趣 而 有 用 的 问题 ) 中 ， 避 免 蛮 力 搜索 的 努力 还 没有 成 功 ， 求 解 它 
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们 的 多 项 式 时 间 算 法 还 没有 找到 。 

为 什么 对 这 些 问 题 寻找 多 项 式 时 间 算 法 还 没有 取得 成 功 呢 ? 我 们 不 知道 这 个 重要 问题 
的 答案 是 什么 。 可 能 这 些 问题 具有 基于 未 知 原理 的 多 项 式 时 间 算 法 ， 但 至 今 还 没有 被 发 
现 ， 或 者 它们 中 的 某 些 问题 就 是 不 能 在 多 项 式 时 间 内 解决 。 它 们 可 能 是 固有 地 难 计算 的 。 

关于 该 问题 的 一 个 不 寻常 的 发 现 是 ， 许 多 问题 的 复杂 性 是 联系 在 一 起 的 。 发 现 其 中 一 
个 问题 的 多 项 式 时 间 算 法 可 以 用 来 解决 整个 一 
类 问题 。 从 一 个 例子 开始 来 理解 这 一 现象 。 

Am K G 中 的 哈密 顿 路 径 (Hamiltonian 
path) 是 通过 每 个 结 点 恰好 一 次 的 有 向 路 径 。 考 
虑 这 样 一 个 问题 : 验证 一 个 有 向 图 是 否 包 含 一 条 
哈密 顿 路 径 连 接着 两 个 指定 的 结 点 ， 如 图 7-3 所 
x. 图 7-3 哈密 顿 路 径 经 过 每 个 结 点 恰好 一 次 

HAMPATH=((G,s,0)|\Ge@eKs A| t 的 哈密 顿 路 径 的 有 向 图 } 

通过 修改 定理 7. 12 给 出 的 PATH 的 蛮 力 算法 ， 很 容易 获得 HAMPATH 问题 的 指数 
时 间 算 法 。 只 需 增 加 一 项 检查 ， 验 证 可 能 的 路 径 是 哈密 顿 路 径 。 没 有 人 知道 HAMPATH 
是 否 能 在 多 项 式 时 间 内 求解 。 

HAMPATH 问题 还 具有 一 个 特点 ， 称 为 多 项 式 可 验证 性 (polynomial verifiability)， 
这 对 于 理解 它 的 复杂 性 很 重要 。 虽 然 还 不 知道 一 种 快速 〈 即 多 项 式 时 间 ) 的 方法 来 确定 图 
中 是 否 包 含 哈密 顿 路 径 ， 但 是 如 果 以 某 种 方式 〈 可 能 采用 指数 时 间 算 法 ) 找到 这 样 的 路 
径 ， 就 能 很 容易 让 人 相信 它 的 存在 ， 这 只 需 给 出 它 即 可 。 换 言 之 ， 验 证 哈密 顿 路 径 的 存在 
性 可 能 比 确定 它 的 存在 性 容易 得 多 。 

另 一 个 多 项 式 可 验证 的 问题 是 合 数 性 。 回 忆 一 下 ， 当 一 个 自然 数 是 两 个 大 于 1 的 整数 
的 乘积 时 ， 称 该 自然 数 为 合 数 (composite) 〈 即 合 数 就 是 非 素数 的 数 ) 。 令 

COMPOSITES=({2x|z=pq, 整数 psq>1} 
虽然 不 知道 判定 该 问题 的 多 项 式 时 间 算 法 ,但 是 能 轻易 地 验证 一 个 数 是 合 数 一 一 只 需要 该 
数 的 一 个 因子 即 可 。 最 近 ， 发 现 了 一 个 可 验证 某 数 是 素数 还 是 合 数 的 多 项 式 时 间 算 法 ， 但 
它 比 前 面 提 到 的 合 数 性 验证 方法 更 复杂 。 

有 些 问题 可 能 不 是 多 项 式 可 验证 的 。 例 如 ，HAMPATH， 即 HAMPATH 问题 的 补 
问题 。 尽 管 能 够 (以 某 种 方式 ) 判定 图 中 没有 哈密 顿 路 径 ， 但 如 果 不 采用 原先 做 判定 时 用 
的 那个 指数 时 间 算 法 ， 就 没有 其 他 办 法 让 别人 验证 它 的 不 存在 性 。 下 面 是 形式 化 的 定义 。 

语言 A 的 验证 机 (verifier) 是 一 个 算法 了， 这 里 

A 王 (四 | 对 某 个 字符 串 c，V 接受 《vw,c)) 
因为 只 根据 取 的 长 度 来 度量 验证 机 的 时 间 ， 所 以 多 项 式 时 间 验 证 机 (polynomial time veri 
fier) 在 ww 的 长 度 的 多 项 式 时 间 内 运行 。 若 语言 A 有 一 个 多 项 式 时 间 验 证 机 ， 则 称 它 为 多 
项 式 可 验证 的 (polynomially verifiable), 

验证 机 利用 额外 的 信息 〈 在 定义 7. 15 中 用 符号 c 表示 ) 来 验证 字符 串 c 是 A 的 成 员 。 
该 信息 称 为 A 的 成 员 资 格 证 书 (certificate) 或 证 明 (proof) 。 注 意 ， 对 于 多 项 式 验 证 机 ， 
证 书 具 有 多 项 式 的 长 度 (w 的 长 度 )， 因 为 这 是 该 验证 机 在 它 的 时 间 界 限 内 所 能 访问 的 全 
部 信息 长 度 。 把 该 定义 应 用 到 语言 HAMPATH 和 COMPOSITES 上 。 
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对 于 HAMPATH H, FR (G,s,t) € HAMPATH 的 证 书 就 只 是 一 条 从 s Bt 
的 哈密 顿 路 径 。 对 于 COMPOSITES 问题 ， 合 数 z 的 证 书 只 是 它 的 一 个 因子 。 在 这 两 种 
情况 下 ， 当 把 证 书 交 给 验证 机 以 后 ， 它 就 能 在 多 项 式 时 间 内 检查 输入 是 否 在 语言 
Een NP 是 具有 多 项 式 时 间 验 证 机 的 语言 类 。 

NP 类 是 重要 的 ， 因 为 它 包 含 许多 具有 实际 意义 的 问题 。 从 前 面 的 讨论 可 知 ，HAMPATH 
Al COMPOSITES 都 是 NP 的 成 员 。COMPOSITES 也 是 NP 的 子 集 P 的 成 员 ， 但 要 证 明 
这 个 更 强 的 结论 非常 困难 。 术 语 NP 即 非 确定 型 多 项 式 时 间 (nondeterministic polynomial 
time)， 来 源 于 使 用 非 确定 型 多 项 式 时 间 图 灵机 的 另 一 特征 。 在 NP 中 的 问题 有 时 被 称 为 
NP 问题 。 

下 面 是 一 个 在 非 确定 型 多 项 式 时 间 内 判定 HAMPATH 问题 的 非 确 定型 图 灵机 
(NTM)。 回 忆 一 下 ， 在 定义 7.9 中 ， 和 定义 非 确 定型 机 器 的 时 间 为 最 长 计算 分 支 所 用 的 
时 间 。 

Ni 二 “对 输入 〈G,s,t)， 这 里 G 是 包含 结 点 s Mt 的 有 向 图 : 

1. 写 一 列 m 个 数 p1,p2，,…,pm，m ÆG 的 结 点 数 。 列 中 每 一 个 数 都 是 从 1 到 m 
中 非 确 定 地 挑选 。 

2. 在 列 中 检查 重复 性 ， 若 发 现 有 重复 ， 则 拒绝 。 

3. 检查 s 二 pl M t= pm 是 否 都 成 立 。 若 有 一 个 不 成 立 ， 则 拒绝 。 

4. 对 于 1 到 m 一 1 中 的 每 一 个 ?1， 检 查 (6.041) 是 否 是 G 的 一 条 边 。 若 有 一 
个 不 是 ， 则 拒绝 。 否 则 ， 所 有 检查 都 通过 了 ， 接 受 。” 

为 了 分 析 该 算法 并 且 验 证 它 在 非 确 定型 多 项 式 时 间 内 和 运行， 考察 它 的 每 一 步骤 。 在 步 
又 1 中 ， 非 确定 的 选择 显然 在 多 项 式 时 间 内 运行 。 在 步骤 2 和 3 中 ， 每 一 步 是 一 次 简单 的 
检查 ， 所 以 合 起 来 它们 仍 在 多 项 式 时 间 内 运行 。 最 后 ， 步 骤 4 显然 也 在 多 项 式 时 间 内 运 
行 。 于 是 ， 该 算法 在 非 确定 型 多 项 式 时 间 内 运行 。 | 

一 个 语言 在 NP 中 ， 当 且 仅 当 它 能 被 某 个 非 确定 型 多 项 式 时 间 图 灵机 判定 。 

证 明 思 路 ”我们 证 明 怎 样 把 一 个 多 项 式 时 间 验 证 机 转化 为 等 价 的 多 项 式 时 间 NTM 以 
及 怎样 反问 转化 。NTM 通过 猜想 证 书 来 模拟 验证 机 ， 验 证 机 通过 把 接受 分 支 作 为 证 书 来 
模拟 NTM, 

证 明 ”对 于 该 定理 从 左 向 右 的 方向 ， 设 AE NP， 要 证 A 被 多 项 式 时 间 NTM N 判定 。 
由 NP 的 定义 ， 存 在 A 的 多 项 式 时 间 验 证 机 V. Bit V 是 一 个 在 时 间 n* 内 运行 的 图 灵机 ， 
构造 N 如 下 : 

N = 二 “对 长 为 n WRA w: 

1. 非 确 定 地 选择 最 长 为 n 的 字符 串 c。 
2. 在 输入 (w,c〉 上 运行 V。 
3. AV He, WMHS; 否则 拒绝 。” 

为 了 证 明 该 定理 的 另 一 个 方向 ， 假 设 A 被 多 项 式 时 间 NIM N 判定 ， 构 造 多 项 式 时 间 
验证 机 VV 如 下 : 

V = 二 “对 输入 lwc), KE w, 是 字符 串 : 

1. 在 输入 w 上 模拟 N， 把 c 的 每 一 个 符号 看 作 是 对 每 一 步 所 做 的 非 确定 性 选择 
的 描述 (正如 在 定理 3. 10 的 证 明 中 那样 ) 。 
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2 若 N 的 当前 计算 分 支 接受 ， 则 接受 ; 否则 拒绝 。” s 

类 似 于 确定 型 时 间 复 杂 性 类 TIMEGC)), LIER ERARE NTIME(z(z) ) 。 

NTIME(t(n)) ={L|L 是 一 个 被 O(t(n)) 时 间 的 非 确定 型 图 灵机 判定 的 
She 

NP= U,NTIME(#), 

NP 类 对 于 合理 的 非 确定 型 计算 模型 的 选择 不 敏感 ， 因 为 所 有 这 些 模型 都 是 多 项 式 等 
价 的 。 在 描述 和 分 析 非 确定 型 多 项 式 时 间 算 法 时 ， 遵 循 前 面 的 确定 型 多 项 式 时 间 算 法 的 习 
惯 。 非 确定 型 多 项 式 时 间 算 法 的 每 一 步 必 须 在 合理 的 非 确定 型 计算 模型 上 ， 在 非 确定 的 多 
项 式 时 间 内 应 该 可 以 明显 地 实现 。 分 析 算 法 以 证 明 每 一 分 支 最 多 使 用 多 项 式 个 步骤 。 


7.3.1 NP 中 的 问题 举例 
无 向 图 中 的 一 个 团 (clique〉 是 一 个 子 图 ， 其 中 每 两 个 结 点 都 有 边 相 连 。 上 上 Ck 


clique) 就 是 包含 个 结 点 的 团 。 图 7- 4 展示 一 个 包含 5 团 人 ~ ~ O 
SEEK 


的 图 。 
团 问题 骨 在 判定 一 个 图 是 否 包含 指定 大 小 的 团 。 念 
图 7-4 包含 5 团 的 图 


CLIQUE 二 {(G,k)|G 是 包含 团 的 无 向 图 } 
CLIQUE & + NP. 
证 明 思 路 ” 团 即 是 证 书 。 
证 明 下面 是 CLIQUE 的 验证 机 VV。 
V= 二 “对 输入 〈(G,k) ,cc): 
1. 检查 c 是 否 是 G 中 个 结 点 的 子 图 。 
2. 检查 G 是 否 包含 连接 c 中 结 点 的 所 有 边 。 
3. 若 两 项 检查 都 通过 ， 则 接受 ; 否则 ， 拒 绝 。” 
另 一 种 证 明 如 果 读 者 喜欢 从 非 确定 型 多 项 式 时 间 图 灵机 的 角度 来 理解 NP 类 ， 那 么 
可 以 通过 给 出 判定 CLIQUE 的 图 灵机 来 证 明 本 和 定理。 注意 这 两 种 证 明 的 相似 性 。 
N= 二 “对 输入 (G.k), XE G 是 一 个 图 : 
1. 非 确定 地 选择 G 中 & 个 结 点 的 子 集 c。 
2. 检查 G 是 否 包 含 连接 c 中 结 点 的 所 有 边 。 
3. 若是 ， 则 接受 ; 否则 拒绝 。” m 
下 面 考 虑 与 整数 算术 有 关 的 问题 SUBSET-SUM。 给 定 一 个 数 集 xis r 和 一 个 目 
标 数 上 ， 要 判定 在 这 个 集合 中 是 否 有 一 个 加 起 来 等 于 上 的 子 集 。 即 
SUBSET-SUM = {(s,t)|s ={215°,2e}> HEE 
{yi ty yr} Cixi sr te} E Eyi =t} 
lun, <{4,11,16,21,27},25) E€ SUBSET-SUM, WH 4+21=25, HR (zl zx》 和 
{y1，"… ,yi} RAVES BE (multiset) ， 因 此 人 允许 元 素 重 复 。 
SUBSET SUM 属于 NP. 
证 明 思 路 ” 子 集 就 是 证 书 。 
证 明 下 面 是 SUBSET-SUM 的 一 个 验证 机 V. 
V==“ 对 输入 〈(S,t) ,c): 





1. 检查 c 是 否 是 加 起 来 等 于 t 的 数 的 集合 。 
2. 检查 S 是 否 包 含 c 中 的 所 有 数 。 
3. 车 两 项 检查 都 通过 ， 则 接受 ; 否则 拒绝 。” 
另 一 种 证 明 还 可 以 通过 给 出 判定 SUBSET-SUM 的 非 确 定型 多 项 式 时 间 图 灵机 来 证 
明 本 定理 ， 如 下 所 示 : 
N= 二 “对 输入 《5S,?): 
1. 非 确 定 地 选择 S 中 的 数 的 一 个 子 集合 c。 
2. 检查 c 是 否 是 加 起 来 等 于 上 的 数 的 集合 。 
3. ARAM, Wee; 否则 拒绝 。” m 
注意 这 些 集合 的 补 集 (CLIQUE 和 SUBSET-SUM) 不 是 很 明显 地 属于 NP。 验 证 某 种 
事物 不 存在 好 像 要 比 验证 它 存在 更 加 困难 。 我们 定义 另外 一 个 复杂 性 类 ， 称 为 coNP， 它 
包括 NP 中 的 语言 的 补 语言 。 还 不 知道 coNP ERS NP A. 





7.3.2 P 与 NP 问题 


如 前 所 述 ，NP 是 在 非 确定 型 图 灵机 上 多 项 式 时 间 内 可 解 的 语言 类 ， 或 者 等 价 地 说 ， 
是 成 员 资格 可 以 在 多 项 式 时 间 内 验证 的 语言 类 。P 是 成 员 资 格 可 以 在 多 项 式 时 间 内 判定 的 
语言 类 。 把 这 些 内 容 总 结 如 下 ， 其 中 ， 把 多 项 式 时 间 可 解 的 粗略 地 称 为 “快速 地 ”可 
- 解 的 。 

P 王 成 员 资 格 可 以 快速 地 判定 的 语言 类 。 

NP= 王 成 员 资格 可 以 快速 地 验证 的 语言 类 。 

前 面 已 经 给 出 了 语言 的 例子 ， 如 HAMPATH 和 CLIQUE， 它 们 是 NP 的 成 员 ， 但 不 
知道 是 否 属于 了 P。 多 项 式 可 验证 性 的 能 力 似乎 比 多 项 式 可 判定 性 的 能 力 大 得 多 。 但 难以 想 
象 的 是 ，P 和 NP 也 有 可 能 是 相等 的 。 现 在 还 无 法 证 明 在 NP 中 存在 一 个 不 属于 了 的 语言 。 

P=NP 是 否 成 立 的 问题 是 理论 计算 机 科学 和 当代 数学 中 最 大 的 悬而未决 的 问题 之 一 。 
如 果 这 两 个 类 相等 ， 那 么 所 有 多 项 式 可 验证 的 问题 都 将 是 多 项 式 可 判定 的 。 大 多 数 研 究 者 
相信 这 两 个 类 是 不 相等 的 ， 因 为 人 们 已 经 投入 了 大 量 
的 精力 为 NP 中 的 某 些 问题 寻找 多 项 式 时 间 算 法 ， 但 
没 人 取得 成 功 。 研 究 者 还 试图 证 明 这 两 个 类 是 不 相等 
的 ， 但 是 这 要 求证 明 不 存在 快速 算法 来 代替 蛮 力 搜索 。 
目前 科学 研究 还 无 法 做 到 这 一 步 。 图 7-5 显示 了 两 种 C) 

可 能 性 。 

已 知 最 好 的 判定 语言 是 NP 的 确定 型 方法 使 用 指 

数 时 间 。 换 言 之 ， 可 以 证 明 图 7-5 这 两 个 可 能 中 有 一 个 是 正确 的 
NPGEXPTIME= U TIME(2” ) 


但 是 ， 不 知道 NP 是 否 包含 在 某 个 更 小 的 确定 型 时 间 复 杂 性 类 中 。 


7.4 NP 完全 性 


在 P 与 NP 问题 上 的 一 个 重大 进展 是 在 20 世纪 70 年 代 初 由 斯 蒂 芬 。 库 克 (Stephen 
Cook) 和 列 奥 尼 德 。 列 文 (Leonid Levin) 完成 的 。 他 们 发 现 NP 中 某 些 问题 的 复杂 性 与 
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整个 类 的 复杂 性 相关 联 。 这 些 问 题 中 任何 一 个 如 果 存 在 多 项 式 时 间 算 法 ， 那 么 所 有 NP 问 
题 都 是 多 项 式 时 间 可 解 的 。 这 些 问题 称 为 NP 完全 的 (NP-complete), NP 完全 性 现象 对 
于 理论 与 实践 都 具有 重要 意义 。 

在 理论 方面 ， 试 图 证 明 P 不 等 于 NP 的 研究 者 可 以 把 注意 力 集中 到 一 个 NP 完全 问题 
E. WR NP 中 的 某 个 问题 需要 多 于 多 项 式 时 间 ， 那 么 NP 完全 问题 也 一 定 如 此 。 而 且 ， 
试图 证 明 P 等 于 NP 的 研究 者 只 需 为 一 个 NP 完全 问题 找到 多 项 式 时 间 算 法 就 可 以 达到 目 
的 了 。 

在 实践 方面 ，NP 完全 性 现象 可 以 防止 为 某 一 具体 问题 浪费 时 间 去 寻找 本 不 存在 的 多 
项 式 时 间 算 法 。 虽 然 ， 可 能 缺乏 足够 的 数学 依据 来 证 明 该 问题 在 多 项 式 时 间 内 不 可 解 ， 但 
是 我 们 相信 了 不 等 于 NP， 所 以 ， 证 明 一 个 问题 是 NP 完全 的 就 成 为 它 的 非 多 项 式 性 的 一 
个 强 有 力 的 证 据 。 

给 出 的 第 一 个 NP 完全 问题 称 为 可 满足 性 问题 (satisfiability problem)。 回 忆 一 下 ， 
取 值 为 TRUE Al FALSE 的 变量 称 为 布尔 变量 (Boolean variable) (H, 0.2 节 )。 通 常用 1 
表示 TRUE, FAO 表示 FALSE。 布 尔 运 算 (Boolean operation) AND, OR, NOT 分 别 
表示 为 人 A，V ， 一 。 这 些 运 算 在 下 表 中 描述 。 用 上 横 线 作 为 一 符号 的 缩写 ， 所 以 碟 的 意思 
Jet 18s 


0A0=0 0V0=0 G=1 
0A1=0 OV1= 1=0 
1A0=0 1V0=1 
JÄ jd iyI=1 


布尔 公式 (Boolean formula) 是 包含 布尔 变量 和 运算 的 表达 式 。 例 如 ， 
g=(@Ny) V(x Az) 
是 一 个 布尔 公式 。 如 果 对 变量 的 某 个 0，1 赋值 使 得 一 个 公式 的 值 等 于 1， 则 该 布尔 公式 是 
可 满足 的 (satisfiable)。 上 面 的 公式 是 可 满足 的 ， 因 为 赋值 z 王 0，y 王 1，z 一 0 使 得 的 
值 为 1。 称 该 赋值 满足 #4。 可 满足 性 问题 (satisfiability problem) 就 是 判定 一 个 布尔 公子 
是 否 是 可 满足 的 。 令 
SAT={(p) |p 是 可 满足 的 布尔 公式 )} 

现在 表述 一 个 把 SAT 问题 的 复杂 性 与 NP 中 所 有 问题 的 复杂 性 联系 起 来 的 定理 。 

SATEP, 48422 P=NP, 

下 面倒 述 该 定理 证 明 的 核心 方法 。 


7.4.1 多 项 式 时 间 可 归 约 性 


在 第 5 章 中 ， 定 义 了 把 一 个 问题 归 约 到 另 一 个 问题 的 概念 。 当 问题 A 归 约 到 问题 B 
时 ，B 的 解 就 可 以 用 来 求解 A。 现在 定义 一 种 关于 计算 效率 的 可 归 约 性 。 当 问题 A 有 效 地 
归 约 到 问题 B 时 ，B 的 有 效 解 就 可 以 用 来 有 效 地 求解 A。 

若 存 在 多 项 式 时 间 图 灵机 M， 使 得 在 任何 输入 w 上 ，M 停机 时 fw) 
恰好 在 带子 上 ， 则 称 函 数 f:5* 一 3* ASMUAH ADH ABB (polynomial time computa- 


ble function) 。 
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语言 A 称 为 多 项 式 时 间 映 射 可 归 约 2 (polynomial time mapping reduci- 
ble) 到 语言 B， 或 简称 为 多 项 式 时 间 可 归 约 〈polynomial time reducible) 到 B， 记 为 
A 三 pB， 若 存在 多 项 式 时 间 可 计算 函数 f:5* 一 >* ， 对 于 每 一 个 记 ， 有 

weASfl(wEB 
hm f AAA 到 B 的 多 项 式 时 间 归 约 (polynomial time reduction) 。 

多 项 式 时 间 可 归 约 性 是 5.3 节 定 义 的 映射 可 归 约 
性 的 有 效 近 似 。 还 有 其 他 形式 的 有 效 可 归 约 性 ， 但 是 
多 项 式 时 间 可 归 约 性 是 一 种 简单 形式 ， 而 且 就 我 们 的 
目的 而 言 也 已 足够 ， 所 以 不 在 这 里 讨论 其 他 形式 。 
图 7-6 展示 的 是 多 项 式 时 间 可 归 约 性 。 

如 同一 般 的 映射 归 约 一 样 ，A 到 B 的 多 项 式 时 间 
归 约 提供 了 一 种 方法 ， 把 A 的 成 员 资格 判定 转化 为 也 
的 成 员 资 格 判 定 ， 只 是 现在 这 种 转化 是 有 效 地 完成 
的 。 为 了 判定 是 否 wEA, FAN f Pw 映射 为 
f(w)， 然 后 判定 是 否 f(w) €B. 

如 果 一 个 语言 能 多 项 式 时 间 可 归 约 到 另 一 个 已 知 有 多 项 式 时 间 算 法 的 语言 ， 就 可 以 获 
得 第 一 个 语言 的 多 项 式 时 间 算 法 ， 如 下 面 的 定理 所 述 。 

# A<, B EBEP, i) AEP. 

证 明 设 M 是 判定 B 的 多 项 式 时 间 算法 ，f 是 从 A 到 B 的 多 项 式 时 间 归 约 。 判 定 A 
的 多 项 式 时 间 算 法 N 的 描述 如 下 : 

N= 二 “对 输入 w: 

1. 计算 flw). 
2. 在 输入 fw) 上 运行 M， 输 出 M 的 输出 。” 

GweA, Il f(WEB, AN feMA 到 B 的 归 约 。 于 是 ， 只 要 wEA，M 就 接受 
fiw). AJr KA N 的 两 个 步骤 都 在 多 项 式 时 间 内 运行 ， 所 以 NN 在 多 项 式 时 间 内 运行 。 
tA, PR 2 在 多 项 式 时 间 内 运行 是 因为 两 个 多 项 式 的 合成 还 是 多 项 式 。 a 

在 进一步 说 明 多 项 式 时 间 归 约 之 前 ， 先 介绍 3SAT， 它 是 可 满足 性 问题 的 一 种 特殊 情 
况 ， 因 为 其 中 所 有 公式 都 具有 一 种 特殊 形式 。 文 字 (iteral) 是 一 个 布尔 变量 或 布尔 变量 
NSE, Wrz., FA (clause) 是 由 V 连接 起 来 的 奉 干 文字 ， 如 C Vz V z3 V z4). — 
个 布尔 公式 在 是 由 人 连接 的 在 干 子 句 组 成 ， 则 为 合 取 范 式 (conjunctive normal form) W, 
REA cnf 公式 ， 如 

(wr N 2a V zs V aad A Ces V zs V oe) A Coe V zs) 
AMAT MRA =Th IMF, WA 3cnf 公式 ， 如 
Con V ee VW oe) A Gam V oe V oe? A Ges V oe V ad A Gea Va V xed 
& 3SAT= {4616 是 可 满足 的 3cnf 公式 }。 如 果 一 个 赋值 满足 一 个 cnf 公式 ， 那 么 每 一 个 
子 句 必须 至 少 包含 一 个 值 为 1 的 文字 。 
下 面 的 定理 给 出 从 3SAT 问题 到 CLIQUE 问题 的 多 项 式 时 间 归 约 。 





图 7-6 从 A 到 B 的 多 项 式 
时 间 归 约 函 数 f 


O 某 些 其 他 教科 书 称 它 为 多 项 式 时 间 多 一 可 归 约 性 (polynomial time many-one reducibility) 。 
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CEREO SAT $ HAM iT) 4 5] CLIQUE. 

证 明 思 路 ”给 出 从 3SAT 到 CLIQUE 的 多 项 式 时 间 归 约 f， 它 把 公式 转化 为 图 。 在 构 
造 的 图 中 ， 指 定 大 小 的 团 对 应 于 公式 的 满足 赋值 。 图 中 的 结构 被 设计 好 用 来 模拟 变量 和 子 
句 的 作用 。 

证 明 设 $ 是 有 个子 句 的 公式 ， 如 

$= Qar Vb, Verid A Caz V b2 Vird Aves A Cag V bp V ce) 
IA f 生成 字符 串 (G.k), HP G 是 如 下 定义 的 无 回 图 。 

G 中 的 结 点 分 成 & 组 ， 每 组 三 个 结 点 ， 称 为 三 元 组 (triple) no... BR=IAM 
应 于 $$ 中 的 一 个 子 句 ， 三 元 组 中 的 每 个 结 点 对 应 于 相应 子 句 的 一 个 文字 。G 的 每 个 结 点 用 
它 对 应 的 $ 中 的 文字 做 标记 。 

除 两 种 情形 以 外 ，G 的 边 连 接 了 所 有 的 结 点 对 。 
同一 个 三 元 组 内 的 结 点 无 边 相 连 ， 相 反 标 记 的 两 个 
结 点 无 边 相 连 ， 如 zz 和 zs。 例如 当 p= Ca Va V 
x2) N Cr Vz Vaz) A Ca Vz Va) 时 ,图 7-7 表 
示 了 这 种 构造 。 

现在 说 明 这 种 构造 为 何 能 发 挥 作用 ,证 明 ¢ 是 
可 满足 的 当 且 仅 当 G 有 大 团 。 人 

假定 6 有 满足 赋值 。 在 满足 赋值 下 ， 每 个 子 句 Cri Vz: Vrz) AVe Vz) 生成 的 图 
中 至 少 一 个 文字 为 真 。 在 G 的 每 个 三 元 组 中 ， 选 择 在 该 满足 赋值 下 为 真 的 文字 对 应 的 结 
点 。 如 果 在 某 一 子 句 中 不 止 一 个 文字 为 真 ， 任 意 选 择 一 个 真 文字 即 可 。 选 择 出 来 的 结 点 将 
恰好 形成 一 个 二 团 。 因 为 是 从 & 个 三 元 组 中 的 每 一 个 中 挑选 一 个 结 点 ， 所 以 选择 的 结 点 数 
为 &。 每 一 对 选中 的 结 点 都 有 边 相 连 ， 它 们 都 不 是 前 面 描述 的 两 种 例外 情形 。 它 们 不 可 能 
来 目 同 一 三 元 组 ， 因 为 从 每 个 三 元 组 中 只 选 一 个 结 点 。 它 们 也 不 可 能 有 相反 标记 ， 因 为 它 
们 关联 的 文字 在 该 满足 赋值 下 都 为 真 。 所 以 G 包含 &- 团 。 

假定 G 有 &- 团 。 因 为 在 同一 个 三 元 组 中 的 结 点 都 无 边 相 连 ， 所 以 团 中 的 任何 两 个 结 点 
都 不 在 同一 个 三 元 组 中 。 因 此 个 三 元 组 中 的 每 一 个 都 恰好 包含 团 的 一 个 结 点 。 给 $$ 的 变 
量 赋 真 值 ， 使 得 标记 团结 点 的 每 个 文字 都 为 真 。 这 可 以 办 到 ， 因 为 具有 相反 标记 的 两 个 结 
点 无 边 相 连 ， 所 以 不 可 能 两 个 都 在 团 中 。 给 变量 的 这 种 赋值 满足 上 ， 因 为 每 个 三 元 组 包含 
一 个 团结 点 ， 所 以 每 个 子 句 包含 一 个 赋值 为 TRUE WLF. p 可 满足 。 m 

定理 7.25 和 定理 7.26 说 明 ， 如 果 CLIQUE 在 多 项 式 时 间 内 可 解 ， 那 么 3SAT 也 如 
此 。 和 在 一 看 ， 这 两 个 问题 之 间 的 联系 显得 很 不 寻常 ， 因 为 表面 上 它们 是 非常 不 同 的 。 但 是 
多 项 式 时 间 可 归 约 性 允许 把 它们 的 复杂 性 联系 起 来 。 现 在 转 癌 一 个 定义 ， 它 允许 用 类 似 的 
方式 把 一 整 类 问题 的 复杂 性 联系 起 来 。 





7.4.2 NP 完全 性 的 定义 


如 果 语 言 B 满足 下 面 两 个 条 件 ， 就 称 为 NP 完全 的 (NP-complete): 
1.B 属 于 NP， 并且 

2. NP 中 的 每 个 A 都 多 项 式 时 间 可 归 约 到 B。 

若 上 述 的 B 是 NP 完全 的 ， 且 BEP， 则 P=NP, 
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证 明 ”从 多 项 式 时 间 可 归 约 性 的 定义 直接 可 得 。 m 

若 上 述 的 BENPZ2%, HBX,C, CAFNP, MCZNPHAM. 

证 明 已 知 C 属于 NP， 必 须 证 明 NP 中 每 一 个 A 都 多 项 式 时 间 可 归 约 到 C。 因 为 B 
是 NP 完全 的 ， 所 以 NP 中 的 每 个 语言 都 多 项 式 时 间 可 归 约 到 B， 而 B 又 多 项 式 时 间 可 归 
约 到 C。 多 项 式 时 间 归 约 是 可 以 复合 的 ， 即 若 A 多 项 式 时 间 可 归 约 到 B， 且 C 多 项 式 时 间 
可 归 约 到 B， 则 A 多 项 式 时 间 可 归 约 到 C。 因 此 NP 中 的 每 个 语言 都 多 项 式 时 间 可 归 约 到 
i 


7.4.3 库 克 - 列 文 定理 


一 旦 有 了 一 个 NP 完全 问题 ， 就 可 以 从 它 出 发 ， 通 过 多 项 式 时 间 归 约 得 到 其 他 NP 完 
全 问题 。 然 而 ， 建 立 第 一 个 NP 完全 问题 更 加 困难 。 现 在 ， 通 过 证 明 SAT 是 NP 完全 的 来 
完成 这 一 步 。 

SAT 是 NP 完 全 的 。9 

该 定理 以 另 一 种 形式 描述 了 定理 7. 22。 

证 明 思 路 ”证 明 SAT 属于 NP 是 简单 的 ， 下面 很 快 就 要 证 明 它 。 证 明 的 难点 是 要 证 
NP 中 的 任何 语言 都 多 项 式 时 间 可 归 约 到 SAT. 

为 此 ， 给 NP 中 的 每 一 个 语言 A 构造 一 个 到 SAT 的 多 项 式 时 间 归 约 。A 的 归 约 在 字 
Bw 上 产生 布尔 公式 5， 用 它 模 拟 A 的 NP 机 器 在 输入 w 上 的 运行 。 如 果 机 器 接受 ， 那 
A $$ 有 一 个 满足 赋值 对 应 于 接受 计算 。 如 果 机 器 不 接受 ， 那 么 没有 赋值 能 满足 6. A, 
x HANK g 可 满足 时 ，w 属于 A. 

实际 上 ， 虽 然 必须 处 理 很 多 细节 ,但 是 构造 一 个 以 这 种 方式 运算 的 归 约 在 概念 上 是 简 
单 的 。 一 个 布尔 公式 可 以 包含 布尔 操作 AND, OR 和 NOT， 这 些 操作 形成 了 电子 计算 机 
中 使 用 的 电路 的 基础 。 因 此 ， 可 以 设计 布尔 公式 来 模拟 图 灵机 这 一 事实 上 毫 不 令 人 奇怪 。 细 
节 在 于 这 种 思想 的 实现 上 。 

证 明 首先 ,证 明 SAT 工 属于 NP。 非 确定 型 多 项 式 时 间 机 器 可 以 猜测 给 定 的 公式 y 的 
一 个 赋值 ， 当 赋值 满足 $ 时 接受 。 

Fill, ANP 中 任 取 一 个 语言 A, WER A 多 项 式 时 间 可 归 约 到 SAT。 设 NN 是 在 时 间 
n* 内 判定 A 的 非 确定 型 图 灵机 ，& 是 某 个 常数 。( 为 了 方便 ， 实际 上 假定 N 在 时 间 n* 一 3 
内 运行 ， 但 只 有 那些 对 细节 感 兴趣 的 读者 可 能 会 担心 这 个 次 要 的 地 方 .) 下 面 的 概念 有 助 
于 描述 该 归 约 。 

在 w 上 ,NN 的 对 应 画面 (tableau) 是 一 张 Xn* 的 表格 ， 其 中 行 代表 NN 在 输入 ww 
上 的 一 个 计算 分 支 的 格局 ， 如 图 7- 8 所 示 。 

为 了 方便 ， 以 后 假定 每 一 个 格局 都 以 符号 # 开 始 和 结束 ， 这 样 画 面 的 第 一 列 和 最 后 一 
列 都 是 # 号 。 画 面 的 第 一 行 是 N 在 w 上 的 起 始 格局 ， 每 一 行 都 根据 N 的 转移 肾 数 从 上 一 
行 得 到 。 如 果 画 面 的 某 一 行 是 接受 格局 ， 则 称 该 画面 为 接受 的 (accepting). 

N Æw 上 的 每 一 接受 画面 对 应 N 在 w 上 的 一 个 计算 分 支 。 所 以 判定 N 是 否 接受 w 
的 问题 等 价 于 判定 是 否 存在 N Ew 上 的 接受 画面 的 问题 。 


日 ”该 定理 的 另 一 种 证 明 出 现在 9. 3 节 。 
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Al 7-8 对 应 画面 是 nt* Xn 的 格局 表 


现在 开始 描述 从 A 到 SAT 的 多 项 式 时 间 归 约 f 。 在 输入 w 上， 该 归 约 产生 一 个 公式 
$。 从 描述 $ 的 变量 开始 。 设 Q 和 本 分 别 是 NN 的 状态 集 和 带子 字母 表 。 令 C= 二 QUTU 
(Hls 对 于 每 个 介 于 1 到 吉之 间 的 i Mi 以 及 CC 中 的 每 个 s*， 有 一 个 变量 tij 

E) 个 画面 格子 中 的 每 一 格 称 为 一 个 单元 (cell)。 第 i 行 第 j 列 的 单元 称 为 cell[i,j]， 
并 且 包 含 C 中 的 一 个 符号 。 用 8 的 变量 表示 单元 中 的 内 容 。 若 xij 取 值 1， 则 意味 着 
cellli,j] 包含 s。 

现在 设计 %， 使 得 变量 的 一 个 满足 赋值 确实 对 应 N 在 w 上 的 一 个 接受 画面 。 公式 3 
是 四 部 分 的 AND 运算: geet A $start A $move A $accept， 依 次 描述 每 一 部 分 。 

如 前 面 所 述 ， 开 启 变 量 zxi,;,; 对 应 于 把 符号 s 放 进 cell[i,;]。 为 了 获得 在 赋值 与 画面 
之 间 的 对 应 ， 必 须 保证 的 第 一 件 事 是 赋值 为 每 个 单元 恰好 开启 一 个 变量 。 公 式 ce 确保 这 
一 要 求 ， 它 用 布尔 运算 的 语言 来 表达 这 一 点 : 

deei= A CCV tii AC A ris V zijn))] 


1 
sé 


符号 信和 V 代表 反复 出 现 的 AND AOR, 例如， 上 面 公 式 中 的 一 部 分 
Le 
是 下 式 的 缩写 : 
AA E F d E 

其 中 C={sisz，…s)。 因 此 ，yecu 实 际 上 是 一 个 长 的 表达 式 ， 它 为 画面 中 的 每 个 单元 包 
含 一 个 片段 ， 因 为 1 和 7 从 1 变 到 ww。 每 一 片段 的 第 1 部 分 称 在 相应 单元 中 至 少 一 个 变量 
被 开启 。 每 一 片段 的 第 2 部 分 称 在 相应 单元 中 至 多 一 个 变量 被 开启 ( 照 字 面 意思 就 是 说 ， 
每 一 对 变量 中 至 少 有 一 个 被 关闭 ) 。 这 些 片 段 由 人 运算 连接 起 来 。 

gcell 在 方 括号 中 的 第 1 部 分 规定 ， 至 少 有 一 个 与 每 个 单元 相关 联 的 变量 开启 ; 而 第 2 
部 分 规定 ， 对 每 个 单元 只 有 一 个 变量 开启 。 满 足 p 《从 而 也 满足 pen) 的 任何 变量 赋值 必 
定 使 得 对 每 个 单元 恰好 开启 一 个 变量 。 于 是 ， 任 何 满足 赋值 都 给 表 中 的 每 个 单元 指定 了 一 
个 符号 。 $start > Pmove A paccept 等 部 分 保证 该 表格 确实 是 一 个 接受 画面 ， 如 下 。 

公式 $star 保 证 表 的 第 一 行 是 NEw 上 的 起 始 格 局 ， 它 明确 规定 相应 的 变量 是 开局 的 : 


$start =21,1,# A Tis, A Zl3m A Ziu, NN Xl,nt2,w, 
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公式 yeeert 保 证 接受 格局 出 现在 画面 中 。 它 通过 规定 开启 相应 变量 之 一 来 确保 qs 
( 即 表示 接受 状态 的 符号 ) 出 现在 画面 的 某 一 单元 中 : 


paccept = V Xi,j,g l 
acce 
1<i,j<n 


最 后 ， 公 式 gaove 保 证 画面 的 每 一 行 都 对 应 于 从 上 一 行 的 格局 按照 N 的 规则 合法 转移 
得 到 的 格局 。 它 通过 确保 每 一 个 2X3 窗口 单元 都 是 合法 的 来 保证 这 一 点 。 如 果 一 个 2X3 
的 窗口 不 违反 由 N 的 转移 函数 指定 的 动作 ， 则 称 该 窗口 是 合法 的 〈legal) 。 换 言 之 ， 如 果 
它 可 以 出 现在 从 一 个 格局 正确 地 转移 到 另 一 个 格局 的 过 程 中 ， 该 窗口 就 称 为 合法 的 .9 

HU, a, b, c 是 带子 字母 表 的 成 员 ，q Ma, 是 N 的 状态 。 假 设 在 状态 qo ES 
头 读 取 a 时 ，N 写 一 个 b， 仍 在 状态 g, ， 并 且 右 移 。 在 状态 g, ， 读 写 头 读 取 b 时 ，N 非 确 
定 地 : 

1. 写 一 个 c， 进 入 状态 g, HEB, MA 

2. 写 一 个 a， 进 入 状态 q 并 右 移 。 
形式 地 表示 为 6(qi,a) 二 {(gqi,b,R)}, 6(q,5b)= [azTDb fa [ao falala 
{(q yc,L)，(q yayR))。 该 机 器 的 合法 窗口 的 例 elele ajaja a|alb| 
子 如 图 7-9 所 示 。 (a) (b) te 

在 图 7-9 中 ， 窗 口 (a) b) 是 合法 的 ， 因 afefe 
为 转移 函数 允许 N 以 指明 的 方式 移动 。 窗口 Co) eels oor one 
是 合法 的 ， 因 为 g, 出 现在 顶 行 的 右边 ， 我 们 不 知 
道 读 写 头 在 什么 符号 上 边 。 那 个 符号 可 能 是 a， 图 7-9 合法 窗口 示例 
q, 可 以 把 它 变 为 b， 并 且 向 右 移 。 这 就 有 可 能 产生 该 窗口 ， 所 以 它 不 违反 N 的 规则 。 窗 口 
(d) 显然 是 合法 的 ， 因 为 顶 行 与 底 行 是 相同 的 ， 当 读 写 头 与 窗口 的 位 置 不 相 邻 时 就 会 出 现 
这 种 情况 。 注 意 在 合法 窗口 中 ，# 可 以 出 现在 顶 行 和 底 行 的 左边 或 右边 。 窗 口 (e) BA 
法 的 ， 因 为 紧 靠 顶 行 的 右边 可 能 就 是 状态 q 读 取 符 号 b， 然 后 左 移 使 状态 q 出 现在 底 行 
的 右边 。 最 后 ， 窗 口 O 是 合法 的 ， 因 为 状态 q 可 能 紧 挨 着 顶 行 的 左边 ， 它 把 b 变 为 c， 
REER. 

图 7-10 所 示 的 窗口 对 于 机 器 N 不 是 合法 的 。 

在 窗口 (a) 中 ， 顶 行 中 间 的 符号 不 会 改变 ， 因 aon ete ee 
为 没有 状态 与 它 相 邻 。 窗 口 (b) 不 是 合法 的 ， 因 (a) (b) elele 
为 转移 函数 指明 b 应 变 为 c MAE a. HA (c) 不 
是 合法 的 ， 因 为 在 底 行 出 现 了 两 个 状态 。 

如 果 画 面 的 顶 行 是 起 始 格局 ， 画 面 中 的 每 一 个 窗口 都 是 合法 的 ， 那 么 画 
面 的 每 一 和 行 合法 转移 得 到 的 格局 。 

为 证 明 该 断言 ， 考 虑 画面 中 任何 两 个 相 邻 格局 ， 称 为 上 格局 和 下 格局 。 在 上 格局 中 ， 每 
一 个 包含 带子 符号 且 不 与 状态 符号 相 邻 的 单元 都 是 某 个 窗口 顶 行 的 中 间 单 元 且 窗 口 顶 行 不 含 
状态 。 因 此 该 符号 必定 保持 不 变 ， 出 现在 窗口 的 底 行 中 间 ， 即 出 现在 底 行 格局 的 同一 位 置 。 

窗口 顶 行 的 中 间 单 元 包含 着 状态 符号 ， 这 就 使 相应 的 三 个 位 置 按 照 转移 函数 的 要 求 一 


图 7-10 非法 窗口 示例 


O ”在 这 里 可 以 根据 转移 了 消 数 给 出 合法 窗口 (egal window) 的 精确 定义 。 但 这 么 做 是 非常 乏味 的 ， 而 且 使 人 从 证 
明 主 线 上 分 散 精 力 。 想 要 更 精确 定义 的 读者 可 以 参考 定理 5. 11 ( 即 波斯 特 对 应 问题 ) 的 证 明 中 的 有 关 分 析 。 
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致 更 新 。 因 此 ， 如 果 上 格局 是 合法 格局 ， 那 么 下 格局 也 是 ， 并 且 下 格局 是 根据 N 的 规则 
从 上 格局 转移 得 到 。 注 意 ， 这 个 证 明显 然 易 懂 ， 但 它 的 关键 依赖 于 选择 了 大 小 为 2X3 的 
窗口 ， 如 问题 7. 26 所 说 明 的 。 

ILE] $move 的 构造 ， 它 规定 画面 中 的 所 有 窗口 都 是 合法 的 。 每 个 窗口 包含 6 个 单 
元 ， 它 们 可 以 用 固定 数目 的 方式 设置 为 合法 窗口 。 公 式 $move 指 出 ， 这 6 个 单元 的 设置 必 
须 是 这 几 种 方式 之 一 ， 即 

fno= A ” (i, 让 -窗口 是 合法 的 ) 


1<i<n ,1<j<n 
位 于 (i,7)- 窗 口 项 部 居中 位 置 的 是 单元 Li,;」。 把 这 个 公式 中 的 文字 “(i,j)- 窗 口 是 合 法 
的 ” 替换 为 下 面 的 公式 ， 把 窗口 的 6 个 单元 的 内 容 写 为 Ul 9°°* 36; 
V Cp N Zija, NTijtla, NXit+1,j-1,2, AZit+1,j,a, A 2i+1,j+1,2, ) 


1? wae 2a, 


是 一 个 合法 窗口 

下 面 分 析 归 约 的 复杂 性 ， 证 明 它 在 多 项 式 时 间 内 完成 。 为 此 考察 $ 的 大 小 。 首 先 ， 估 
计 一 下 它 的 变量 的 数目 。 回 忆 一 下 ， 画 面 是 一 个 mn* Xnt 表格 ， 所 以 它 包 含 nt 个 单元 。 每 
个 单元 有 与 它 相 关联 的 i 个 变量 ,i 是 C 中 符号 的 数目 。 因 为 /只 依赖 于 图 灵机 N ， 而 不 
依赖 于 输入 的 长 度 n， 所 以 变量 总 数 是 O(n2*)。 

估计 一 下 $$ 的 每 个 部 分 的 大 小 。 对 画面 的 每 个 单元 ， 公 式 $cel 包 含 固定 长 度 的 公式 片 
段 ， 所 以 长 度 为 O(n), AA $start 对 顶 行 的 每 个 单元 包含 一 个 片段 ， 所 以 长 度 为 O). 
公式 pmove 和 accept 对 画面 的 每 个 单元 包含 固定 长 度 的 公式 片段 ， 所 以 它们 的 长 度 为 
Ont). Fe, 的 总 长 为 Oln**)。 该 结果 完全 符合 目标 ， 因 为 它 说 明 p 的 长 度 是 n 的 多 
项 式 。 如 果 长 度 超过 了 多 项 式 关 系 ， 那 么 该 归 约 将 不 可 能 在 多 项 式 时 间 内 生成 它 。 (实际 
上 我 们 少 估 了 一 个 O(logn) 因子 ， 因 为 每 个 变量 的 下 标 可 以 达到 rw*， 要 把 它们 写 进 公式 
可 能 需要 O(logn) 个 符号 。 但 是 这 个 外 加 的 因子 不 改变 结果 的 多 项 式 特性 。) 

为 看 出 能 在 多 项 式 时 间 内 生成 该 公式 ， 注 意 它 的 高 度 重 复 性 。 公 式 的 每 一 部 分 由 许多 
几乎 相同 的 片段 组 成 ， 只 是 在 下 标 上 有 简单 的 变化 。 因 此 可 以 容易 地 构造 一 个 归 约 ， 在 多 
项 式 时 间 内 从 输入 w 生成 $。 s 

这 样 就 完成 了 库 克 - 列 文 定理 的 证 明 ， 证 明 SAT 是 NP 完全 的 。 证 明 其 他 语言 的 NP 
完全 性 通常 不 需要 这 样 长 的 证 明 。NP 完全 性 还 可 以 通过 从 一 个 已 知 为 NP 完全 的 语言 出 
发 的 多 项 式 时 间 归 约 来 证 明 。 为 此 可 以 用 SAT, 但 是 用 3SAT( 即 在 定理 7.26 之 前 定义 
的 SAT 的 特殊 情况 ) 通常 更 加 容易 。 回 忆 一 下 ，3SAT 的 公式 是 合 取 范式 形式 的 ， 每 个 
子 句 有 三 个 文字 。 首 先 ， 必 须 证 明 3SAT 自己 是 NP 完全 的 。 把 它 作为 定理 7. 30 的 推论 
来 证 明 。 

A 3SAT 是 NP 完全 的 。 

证 明 显然 3SAT 属于 NP， 所 以 只 需 证 明 NP 中 的 所 有 语言 都 在 多 项 式 时 间 内 归 约 
到 3SAT。 为 证 明 这 一 点 ， 一 种 方法 是 证 明 SAT 多 项 式 时 间 归 约 到 3SAT。 这 里 改 用 为 一 
种 方法 ， 修 改定 理 7. 30 的 证 明 ， 使 得 它 直 接 产 生 每 个 子 句 有 三 个 文字 的 合 取 范式 形式 的 
aks 

定理 7.30 产生 的 公式 已 经 几乎 是 合 取 范式 形式 的 了 。 公 式 gl 是 子 公式 的 大 合 取 ， 
每 个 子 公式 包含 一 个 大 析 取 以 及 析 取 的 大 合 取 。 因 此 ye 是 子 句 的 合 取 ， 已 经 是 cnf 形式 
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To AÑ ystar 是 变量 的 大 合 取 。 把 每 个 变量 看 作 长 为 LNF A), PABA gsar cnf. 4 
TK yaceept 是 变量 的 大 析 取 ， 因 此 是 单个 子 句 。 公 式 pmovwe 是 唯一 一 个 还 不 是 cnf 的 公式 ， 但 
是 可 以 容易 地 把 它 转化 为 cnf 形式 的 公式 ， 如 下 所 述 。 

回忆 一 下 ，ymove 是 子 公式 的 大 合 取 ， 每 个 子 公式 是 合 取 的 析 取 ， 描 述 了 所 有 可 能 的 合 
法 窗口 。 第 0 章 描述 的 分 配 律 指出 ， 可 以 把 合 取 的 析 取 替换 为 等 价 的 析 取 的 合 取 。 这 人 么 做 
可 能 会 极 大 地 增加 每 个 子 公 式 的 长 度 ， 但 是 $move 的 总 长 只 可 能 增加 常数 倍 ， 因 为 每 个 子 
公式 的 长 度 只 依赖 于 N。 结 果 是 合 取 范式 形式 的 公式 。 

现在 已 经 把 公式 写成 cnf 形式 了 ， 再 把 它 转 化 为 每 个 子 句 拥有 三 个 文字 的 形式 。 在 当 
前 拥有 一 个 或 两 个 文字 的 子 句 中 ， 复 制 其 中 一 个 文字 ， 使 得 文字 总 数 达 到 3。 在 拥有 超过 
3 个 文字 的 子 句 中 ， 把 它 分 裂 为 几 个 子 句 ， 额 外 添加 一 些 变量 来 保持 原 公 式 的 可 满足 性 或 
不 可 满足 性 。 

例如 ， 把 子 句 (ar Vaz Vaz Vas) CRP RT ai 是 一 个 文字 ) 替换 为 两 个 子 句 的 表达 
式 (a Vaz Vxz)A(zVas3Vas)， 其 中 zz 是 新 变 元 。 如 果 ai 的 某 种 赋值 满足 原来 的 子 句 ， 
则 可 以 找到 z 的 某 种 赋值 ， 使 得 这 两 个 新 子 句 被 满足 ， 反 之 亦 然 。 一 般 地 说 ， 如 果子 句 包 
a iPS, w 

Cai Vaz V Vaz) 
则 可 以 用 /一 2 个 子 句 替换 它 ， 如 
Ca; Vaz Ver) Na Vaz V x2) A Cen Vas V 23) A Ns Vi Vaz) 

容易 验证 ， 新 公式 是 可 满足 的 当 且 仅 当 原来 的 公式 是 可 满足 的 ， 证 毕 。 8 


7.5 几 个 NP 完全 问题 


NP 完全 性 现象 是 很 广泛 的 ， 众 多 领域 中 都 有 NP 完全 问题 。 由 于 某 些 没有 被 深入 认 
识 的 原因 ， 多 数 自然 出 现 的 NP 问题 不 是 P 类 就 是 NP 完全 的 。 如 果 在 为 一 个 新 的 NP 问 
题 寻 找 多 项 式 时 间 算 法 ， 付 出 部 分 精力 尝试 证 明 它 是 NP 完全 的 是 一 种 明智 的 做 法 ， 因 为 
这 样 可 以 防止 去 寻找 一 个 并 不 存在 的 多 项 式 时 间 算 法 。 

本 节 再 给 出 几 个 定理 ， 证 明 几 个 不 同 的 语言 是 NP 完全 的 。 这 些 定 理 为 同类 问题 的 证 
明 技 巧 提 供 了 示例 。 一 般 策 略 是 给 出 从 3SAT 到 该 语言 的 多 项 式 时 间 归 约 ， 如 果 更 加 方便 
的 话 ， 有 时 也 从 其 他 NP 完全 语言 归 约 。 

在 构造 从 3SAT 到 一 个 语言 的 多 项 式 时 间 归 约 时 ， 我 们 寻找 这 个 语言 中 能 模拟 布尔 公 
式 的 变量 和 子 句 的 结构 ， 这 种 结构 有 时 称 为 构件 (gadget)。 例 如 ， 在 定理 7.26 中 给 出 的 
从 3SAT 到 CLIQUE 的 归 约 中 ， 结 点 模拟 变量 ， 结 点 的 三 元 组 模拟 子 句 。 一 个 具体 的 结 
点 可 以 是 也 可 以 不 是 团 的 成 员 ， 这 对 应 于 一 个 变量 在 满足 赋值 中 可 以 是 真 ， 也 可 以 不 是 
真 。 每 个 子 句 必须 包含 赋值 为 真 的 文字 。 相 应 地 ， 每 个 三 元 组 必须 包含 团 的 一 个 结 点 ( 团 
要 达到 规定 的 大 小 ) 。 下 面 是 定理 7. 26 的 推论 ， 说 明 CLIQUE 是 NP 完全 的 。 

CLIQUE 是 NP 完全 的 。 


7.5.1 项 点 上 覆盖 问题 


若 G 是 无 向 图 ， 则 G 的 顶点 覆盖 (vertex-cover) 是 结 点 的 一 个 子 集 ， 使 得 G 的 每 条 边 
都 与 子 集中 的 结 点 之 一 相关 联 。 顶 点 覆盖 问题 由 在 确定 图 中 是 否 存 在 指定 规模 的 顶点 覆盖 : 
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VERTEX-COVER 一 {(G,k)|1G 是 具有 有 个 结 点 的 顶点 覆盖 的 无 向 图 ) 


VERTEX-COVER 是 NP 完全 的 。 

证 明 思 路 ”要 证 明 VERTEX-COVER 是 NP 完全 的 ， 必 须 证 明 它 属于 NP ANP 中 的 
所 有 问题 都 能 多 项 式 时 间 归 约 到 它 。 第 一 部 分 较 容 易 : 证 书 就 是 一 个 规模 为 & 的 顶点 覆 
盖 。 通 过 证 明 3SAT 多 项 式 时 间 可 归 约 到 VERTEX-COVER 来 证 明 第 二 部 分 。 该 归 约 将 
一 个 3cnf 公式 4 转换 为 一 个 图 G 和 数值 &， 且 只 要 G 中 有 下 个 结 点 的 顶点 覆盖 ，y 就 能 够 
被 满足 。 转 换 是 在 不 知道 6 能 否 被 满足 的 情况 下 完成 的 。 实 际 上 ，G 模拟 了 yy 。 该 图 包含 
着 构件 、 模 拟 公 式 中 的 变量 和 子 句 。 设 计 这 些 构件 需要 一 点 独 出 心 裁 的 巧 思 。 

对 于 变量 构件 ， 在 G 中 寻找 一 种 结构 ， 它 以 两 种 可 能 的 方式 之 一 参与 到 顶点 覆盖 中 ， 
正好 对 应 变量 的 两 种 可 能 的 真实 赋值 。 变 量 构 件 包 含 两 个 被 一 条 边 连接 的 结 点 。 这 种 结构 
之 所 以 有 效 是 因为 两 个 结 点 之 一 一 定 会 出 现在 顶点 覆盖 中 。 任 意 地 将 两 个 结 点 分 别 与 
TRUE 和 FALSE 关联 起 来 。 

对 于 子 句 构件 ， 要 寻找 这 样 的 结构 : 它 使 得 顶点 覆盖 所 包含 的 变量 构件 结 点 中 ， 
至 少 有 一 个 结 点 对 应 着 该 子 句 中 至 少 一 个 取 值 为 真 的 文字 。 这 个 构件 包含 三 个 结 点 及 
它们 相连 的 边 ， 这 样 任何 一 个 顶点 覆盖 都 一 定 会 包含 它 的 至 少 两 个 结 点 ， 或 者 是 全 部 
三 个 绪 点 。 如 果 构 件 结 点 中 的 一 个 只 是 有 助 于 覆盖 仅仅 一 条 边 ， 则 顶点 覆盖 中 只 需 包 
括 另 外 两 个 结 点 ， 也 就 是 对 应 的 文字 满足 了 该 子 句 的 情况 。 否 则 ， 三 个 结 点 都 必须 履 
盖 。 最 后 ， 选 择 & 值 使 得 找到 的 顶点 覆盖 一 个 结 点 对 应 一 个 变量 构件 ， 两 个 结 点 对 应 
一 个 子 句 构件 。 

证 明 这 里 给 出 一 个 从 3SAT 到 VERTEX-COVER 的 在 多 项 式 时 间 内 运算 的 归 约 的 
细 市 内 容 ， 该 归 约 把 布尔 公式 $ 映射 为 一 个 图 G AR. HF e 中 的 每 个 变量 zx， 产生 一 
条 连接 着 两 个 结 点 的 边 。 把 这 个 构件 中 的 两 个 结 点 标记 为 x Az. W zx 赋值 为 TRUE 对 应 
于 顶点 覆盖 选择 该 边 的 左 结 点 ， 而 赋值 为 FALSE 对 应 于 标记 为 工 的 结 点 。 

对 应 于 子 句 的 构件 稍 有 点 复杂 。 每 个 子 句 的 构件 是 用 该 子 句 的 三 个 文字 标记 的 结 点 组 
成 的 三 元 组 。 这 三 个 结 点 互相 连接 ， 并 且 与 变量 构件 中 具有 相同 标记 的 结 点 相连 接 。 因 此 
出 现在 G 中 的 结 点 总 数 是 2mm 十 32， 其 中 上 有 和 2 个 变量 和 7 个子 句 。 令 上 等 于 m 十 21。 

PG, Æ p= Cr Vai Vaz) A Car V x2 VT) AVV), BAM 6 FE (G,R), 
这 里 & 一 8，C 的 形状 如 图 7- 11 所 示 。 





图 7-11 BA $= (Ca V z V z2) AC V azz V z2) AG Vaz Vz) 产生 的 图 


为 证 明 该 归 约 满足 要 求 ， 需 要 证 明 g 可 满足 当 且 仅 当 G 有 上 个 结 点 的 项 点 覆盖 。 从 一 
个 满足 赋值 开始 ， 首 先 把 变量 构件 中 对 应 于 赋值 中 真 文字 的 结 点 放 入 顶点 覆盖 中 。 然 后 ， 
在 每 个 子 句 中 挑选 一 个 真 文字 ， 把 每 个 子 句 构件 中 剩 下 的 两 个 结 点 放 入 顶点 覆盖 中 ， 现 在 
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共有 上 个 结 点 。 它 们 覆盖 所 有 边 ， 因 为 显然 每 个 变量 构件 的 边 被 覆盖 了 人， 在 每 个 子 句 构 件 
中 的 所 有 三 条 边 也 被 履 盖 了 ， 所 有 介 于 变量 构件 和 子 句 构件 之 间 的 边 也 被 履 盖 了 。 所 以 G 
有 上 个 结 扣 的 项 点 覆盖 。 

EK, WR G 有 上 & 个 结 点 的 顶点 覆盖 ,通过 构造 满足 赋值 来 证 明 8 是 可 满足 的 。 为 了 
覆盖 变量 构件 的 边 和 子 句 构件 的 三 条 边 ， 顶 点 覆盖 必须 包含 每 个 变量 构件 的 一 个 结 点 以 及 
每 个 子 句 构件 的 两 个 结 点 。 这 就 占用 了 全 部 顶点 覆盖 的 结 点 ， 没 有 剩余 的 份额 。 选 取 变 量 
构件 中 在 顶点 覆盖 中 的 结 点 ， 把 相应 的 文字 赋值 为 真 。 这 个 赋值 满足 $6， 因 为 连接 变量 构 
件 和 每 个 子 句 构 件 的 三 条 边 都 被 覆盖 了 ， 而 子 句 构件 中 只 有 两 个 结 点 在 顶点 覆盖 中 ， 所 以 
其 中 一 条 边 必 定 被 变量 构件 中 的 一 个 结 点 覆盖 ， 因 此 赋值 满足 相应 的 子 句 。 本 


7.5. 2 哈密 顿 路 径 问题 


回忆 一 下 ， 哈 密 顿 路 径 问 题 是 问 输 入 图 是 否 包 含 从 s 到 t 恰好 经 过 每 个 结 点 一 次 的 

路 径 。 
HAMPATH 是 NP 完全 的 。 
证 明 思 路 在 7.3 节 已 经 证 明了 HAMPATH 属于 NP 的。 为 证 每 个 NP 问题 多 项 式 
时 间 可 归 约 到 HAMPATH, RAINER 3SAT 多 项 式 时 间 可 归 约 到 HAMPATH,. 给 出 一 
种 方法 ， 把 3cnf 公式 转化 为 图 ， 使 得 图 中 的 哈密 顿 路 径 对 应 于 公式 的 满足 赋值 。 图 中 包 
含 模拟 变量 和 子 句 的 构件 。 变 量 构件 是 一 个 钻石 结构 ， 可 以 两 种 方式 之 一 经 过 ， 对 应 于 两 
种 真 值 赋值 。 子 名 构件 是 一 个 结 点 ， 保 证 路 径 经 过 每 个 子 句 构件 对 应 于 保证 在 满足 赋值 中 
每 个 子 句 都 被 满足 。 

证 明 前面 已 经 证 明 HAMPATH 属于 NP, 还 需要 做 的 就 是 证 明 3SAT 
过 ,HAMPATH 。 对 于 每 个 3cnf 公式 4， 我 们 说 明 怎 样 构造 一 个 包含 两 个 结 点 s 和 + 上 的 有 
HEG, E44 s 和 + 之 间 存 在 哈密 顿 路 径 当 且 仅 当 可 满足 。 

MEE k FAR 3cnf 公式 $ 开始 构造 : 

$= (a V bı V c1) A Caz V b2 V c2) Aves A Car V be V ce) 
其 中 每 个 a, b,c 是 文字 zi Rr. Rao reg 的 ! 个 变量 。 

现在 说 明 怎 样 把 4 转化 为 图 G。 构造 的 图 G 使 用 不 同 的 部 分 表示 出 现在 % 中 的 变量 和 
$y) 

把 每 个 变量 r 表示 为 一 个 包含 一 行 水 平 结 点 的 钻石 形 结构 ， 如 图 7-12 所 示 。 随 后 说 明 
水 平行 包含 的 结 点 数 。 

把 p 的 每 个 子 句 表示 为 单个 结 点 ， 如 图 7- 13 所 示 。 





©. 


图 7-12 变量 x; 表示 为 一 个 钻石 形 结构 图 7-13 EFA c 表示 为 结 点 
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图 7- 14 HT C 的 全 局 结构 。 除 了 表示 变量 与 子 铅 〈 它 包含 着 这 些 变量 ) 关系 的 边 没 


有 画 出 以 外 ， 它 展示 了 G 的 所 有 元 素 及 其 相互 关系 。 

下 面 说 明 怎 样 把 代表 变量 的 钻石 与 代表 子 句 
的 结 点 连接 起 来 。 每 个 钻石 结构 都 包含 一 行 水 平 
结 点 ， 它 们 由 两 个 方向 的 边 连接 起 来 。 在 水 平行 
上 除了 钻石 两 端的 两 个 结 点 以 外 ， 还 包含 3k 十 1 
个 结 点 。 这 些 结 点 被 分 成 相 邻 的 对 ， 每 个 子 句 一 
对 ， 并 且 用 另外 的 结 点 把 这 些 结 点 对 分 隅 开 ， 如 
图 7-15 所 示 。 

WREE x; 出 现在 子 句 c; 中 ， 则 把 图 7- 16 
所 示 两 条 从 第 i 个 钻石 的 第 7 对 结 点 到 第 7 个 子 
句 结 点 的 边 添 加 进去 。 

如 果 z; 出 现在 子 句 c; 中 ， 则 把 图 7- 17 所 示 
两 条 从 第 i 个 钴 石 的 第 7 对 结 点 到 第 7 个 子 句 结 
点 的 边 添加 进去 。 

把 每 一 子 句 中 出 现 的 每 个 zi 或 zi 所 对 应 的 边 
都 添加 进去 以 后 ，G 的 构造 就 完成 了 。 为 了 说 明 
这 种 构造 满足 要 求 ， 我 们 断言 ， 如 果 8 是 可 满足 
的 ， 则 从 s 到 t 存在 哈密 顿 路 径 ; 反之 ， 如 果 存 
在 这 样 的 路 径 ， 则 $ 是 可 满足 的 。 





图 7-15 在 钻石 结构 中 的 水 平 结 点 





图 7-16， 当 子 句 c) 包含 zx; 时 添加 的 边 





假设 $ 是 可 满足 的 。 为 了 展示 从 到 上 的 哈密 顿 路 径 ， 首 先 忽 略 子 句 结 点 。 路 径 从 开 
始 ， 依 次 经 过 每 个 销 石 ， 到 上 终止 。 为 了 经 过 销 石 中 的 水 平 结 点 ， 该 路 径 从 左 到 右 E-A 
式 )， 或 者 从 右 到 左 A-AA) 曲折 前 进 ， 由 o 的 满足 赋值 决定 是 哪 一 种 方式 。 如 果 i 
赋值 为 TRUE， 就 以 左 - 右 式 通过 相应 的 钻石 。 如 果 zi 赋值 为 FALSE， 就 以 右 - 左 式 。 


图 7- 18 展示 了 这 两 种 可 能 。 








zag-zig 


图 7-17 XFA c 包含 zi 时 添加 的 边 图 7- 18 左 - 右 式 和 右 - 左 式 通过 钻石 ， 由 满足 赋值 决定 
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迄今 为 止 ， 该 路 径 履 盖 了 G 中 除 子 句 结 点 以 外 的 所 有 结 点 。 通 过 在 水 平 结 点 上 增加 迁 
回路 ， 可 以 轻易 地 把 子 句 结 点 纳入 路 径 中 。 在 每 个 子 句 中 ， 选 择 一 个 被 满足 赋值 赋 为 
TRUE 的 文字 。 

如 果 在 子 句 c; 中 选择 zx;， 就 能 在 第 i 个 钻石 的 第 7 对 结 点 上 绕 行 。 可 以 这 样 做 是 因为 
Xi 必定 是 TRUE， 该 路 径 从 左 到 右 通 过 相应 的 钻石 。 所 以 连 到 结 点 c; 的 边 的 次 序 正好 允 
许 绕 行 并 返回 。 

类 似 地 ， 如 果 在 子 句 c; 中 选择 了 zx;， 就 能 在 第 i 个 钻石 的 第 7 对 结 点 上 绕 行 ， 因 为 xz; 必 
定 是 FALSE， 该 路 径 从 右 到 左 通过 相应 的 钻石 。 所 以 连 到 结 点 ci 的 边 的 次 序 正好 也 允许 绕 
THR. (注意 ， 子 句 中 的 每 个 真 文字 都 给 经 过 子 句 结 点 的 绕 行 提 供 了 一 种 选择 。 结 果 是 ， 
如 果子 句 中 有 几 个 文字 为 真 ， 则 只 选取 一 条 迁 回 路 .) 这 样 就 构造 好 了 所 需 的 哈密 顿 路 径 。 

对 于 相反 方向 的 证 明 ， 若 G 有 一 条 从 s 到 上 的 哈密 顿 路 径 ， 给 出 一 个 $ 的 满足 赋值 。 
右 该 哈密 顿 路 径 是 正规 的 ， 即 除了 到 子 句 结 点 的 绕 行 以 外 ， 它 从 上 到 下 依次 通过 每 个 销 
石 ， 则 容易 获得 满足 赋值 。 知 它 以 左 - 右 式 通过 钻石 ， 则 把 相应 变量 赋 为 TRUE; 若是 右 - 
左 式 ， 则 赋 为 FALSE。 因 为 每 个 子 句 结 点 都 出 现在 路 径 上 ， 通 过 观察 经 过 它 的 迁 回路 线 
的 情况 ， 可 以 确定 相应 的 子 句 中 哪个 文字 为 TRUE. 

现在 还 需 证 明 的 就 是 哈密 顿 路 径 肯 和 定 是 正规 的 。 违 反正 
规 性 的 唯一 途径 是 路 径 从 一 个 钻石 进入 子 句 结 点 ， 却 返回 到 
另 一 个 钻石 ， 如 图 7- 19 所 示 。 

路 径 从 结 点 al 到 cc， 但 是 没有 返回 到 同一 钻石 的 az ， 而 
是 返回 到 不 同 钻石 的 bo. GK. M a: 或 者 a3 必定 是 分 
隅 结 点 。 如 果 az ENDRA, MA az 的 边 只 能 来 自 a 和 
azs WR as 是 分 隔 结 点 ， 则 ai 和 as 在 同一 子 句 对 中 ， 因 此 
进入 az 的 边 只 能 来 自 a, a3 和 c。 在 这 两 种 情况 下 ， 该 路 
径 都 不 可 能 包含 结 点 az 。 它 不 可 能 从 caka 进入 az ， 因 为 
它 从 这 两 个 结 点 出 发 通 向 别 的 地 方 去 了 。 它 也 不 可 能 从 a, 图 7-19 这 种 情况 不 可 能 发 生 
进入 az ， 因 为 as 是 唯一 仅 存 的 as 所 瞄 向 的 结 点 ， 它 退出 az 后 必须 经 过 as 。 所 以 哈密 顿 
路 径 一 定 是 正规 的 。 该 归 约 显然 在 多 项 式 时 间 内 运算 ， 证 毕 。 # 

下 面 考虑 一 种 无 向 的 哈密 顿 路 径 问 题 ， 称 为 UHAMPATH 。 为 了 证 明 UHAMPATH 
是 NP 完全 的 ， 给 出 从 有 问 的 哈密 顿 路 径 问题 出 发 的 多 项 式 时 间 归 约 。 

UHAMPATH 是 NP 完全 的 。 

证 明 ”对 于 包含 结 点 s 和 zt 的 有 向 图 G， 归 约 构 造 包 含 结 点 s 和 zt 的 无 向 图 G'。 图 G 
As 到 zt 的 哈密 顿 路 径 当 且 仅 当 G 有 从 s 到 :的 哈密 顿 路 径 。 描 述 G 如 下 。 

除了 和 + 以 外 ，G 的 每 个 结 点 u 被 替换 为 CHEE uP, um™, yut, GHA s Alt 
被 替换 为 G 的 结 点 := 和 姻 王 上 。G 有 两 种 类 型 的 边 。 首 先 有 连接 xmid 与 如 以 及 xmid 与 
uR. EK, WR G 中 有 从 到 wv 的 边 ， 则 we™ 与 v= 有 边 相 连 。 这 就 完成 了 G 的 构造 。 

通过 证 明 G 有 从 s 到 t 的 哈密 顿 路 径 当 且 仅 当 G “有 从 so Sl 让 的 哈密 顿 路 径 ， 可 以 说 
明 这 种 构造 满足 要 求 。 为 证 明 一 个 方向 ， 注 意 到 G 中 的 哈密 顿 路 径 P 

Sy 9U2 9°** sUp sl 


在 G 中 有 一 条 对 应 的 哈密 顿 路 径 PP”: 
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为 证 明 另 一 个 方向 ， 我 们 断言 G 中 的 任何 从 so 到 cit ye a a he 2S A an TE BP SR 
路 径 P' 那 样 ， 必 定 是 从 结 点 的 一 个 三 元 组 通 向 另 一 个 三 元 组 ， 起 始 与 结束 的 地 方 除外 。 
这 就 将 完成 本 证 明 ， 因 为 这 样 的 路 径 在 G 中 都 有 对 应 的 哈密 顿 路 径 。 通 过 从 结 点 sex 出 发 ， 
跟踪 该 路 径 来 证 明 本 断言 。 注 意 到 路 径 上 的 下 一 个 结 点 必定 是 uP (对 某 个 让， 因为 只 有 那 
些 结 点 与 so 相连。 再 下 一 个 结 点 必定 是 wr4， 因 为 在 哈密 顿 路 径 中 ， 其 他 方式 都 不 能 包括 
upid。 在 utd 以 后 是 um, RARE uP 连接 到 的 另 一 个 唯一 的 结 点 。 再 下 一 个 结 点 必定 是 
ur 〈 对 某 个 力 ， 因 为 没有 别 的 结 点 可 以 连接 到 ze 。 重 复 这 种 推理 直到 到 达 oH IE. = 


7.5.3 子 集 和 问题 


回忆 定理 7. 21 中 定义 的 SUBSET-SUM 问题 。 在 该 问题 中 ， 有 一 个 数 集 zl ，… ,zx 和 
一 个 目标 数 上 ， 要 判定 该 数 集 是 否 包 含 一 个 加 起 来 等 于 上 的 子 集 。 现 在 证 明 该 问题 是 NP 完 
全 的 。 

SUBSET-SUM 是 NP 完全 的 。 

证 明 思 路 ”定理 7. 21 中 已 经 证 明了 SUBSET-SUM 属于 NP。 通 过 把 NP 完全 语言 
3SAT 归 约 到 它 来 证 明 NP 中 的 所 有 语言 都 多 项 式 时 间 可 归 约 到 SUBSET-SUM 。 给 定 一 
个 3cnf 公式 $6， 构造 问题 SUBSET-SUM 的 一 个 实例 ， 使 其 包含 加 起 来 等 于 目标 t 的 子 集 
当 且 仅 当 y 可 满足 。 该 子 集 称 为 工 。 

为 了 获得 此 归 约 ， 寻 找 SUBSET-SUM 问题 的 结构 来 表示 变量 和 子 句 。 我 们 构造 的 
SUBSET-SUM 问题 的 实例 包含 以 十 进 制 表示 的 很 大 的 数 。 用 数 对 来 表示 变量 ， 用 数 的 十 
进 制 表示 的 某 些 位 来 表示 子 句 。 

用 两 个 数 yi 和 zi 来 表示 变量 x;。 证 明 对 于 每 个 i，y; 或 是 z; 必定 在 TT 中， 以 此 建立 
起 在 满足 赋值 中 x; 的 真 值 的 编码 。 

每 个 子 句 位 置 包含 目标 上 中 的 某 一 值 ， 这 就 对 子 集 工 提出 一 定 的 要 求 。 证 明 这 种 要 求 
与 相应 子 句 中 的 要 求 是 一 致 的 ， 即 要 求 该 子 句 的 文字 
之 一 赋值 为 TRUE. 

证 明 已 知 SUBSET-SUM EE NP， 所 以 现在 来 证 
HH 3SAT<,SUBSET-SUM 。 

设 点 是 一 个 布尔 公式 ， 其 变量 是 riar FH 
FE cists ceo JUANG $ 转化 为 SUBSET-SUM 问题 的 
一 个 实例 S.t), HPS 的 元 素 和 数 t A 7-20 中 以 
通常 的 十 进 制 记 法 表示 的 行 。 双 线 上 面 的 行 标记 为 

Vi 391 9 V2 9Z2 9° 9M ZAM g1 hi, g2 3h2 ,gk he 
它们 组 成 S 的 元 素 。 双 线 下 面 的 行 是 t。 

FTE, HAF p 的 每 个 变量 x;，S 包含 一 对 数 yi 
和 xi。 这 些 数 的 十 进 制 表示 分 为 两 部 分 ， 如 图 7- 20 所 
示 。 左 边 部 分 由 1 和 随后 的 /一 i 个 0 组成。 右边 部 分 
对 应 于 每 个 子 句 有 一 位 数字 ， 当 子 句 cj 包含 文字 zi 时 图 7-20 从 3SAT 到 
yi 在 cj 列 为 1; MFA c 包含 文字 zi 时 z; 在 cj WH SUBSET-SUM 的 归 约 
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1。 未 指明 为 1 的 位 都 是 0。 

图 7- 20 根据 样 例子 句 cl ，cz 和 cx 填写 了 一 部 分 : 

Cxi V Tz V x3) A Cre V z3 View) Noe A ag Vie Vie) 

另外 ，S 对 于 每 个 子 句 cj 包含 一 对 数 g;，h;。 这 两 个 数 相 等 ， 由 1 和 随后 的 一 j 个 0 
组 成 。 

最 后 ， 目 标 数 上 〈 即 表 的 底 行 ) ALT 1 和 随后 的 & 个 3 组 成 。 

接 下 来 ， 说 明 这 种 构造 为 什么 能 满足 要 求 ， 证 明 $ 可 满足 当 且 仅 当 S 的 某 个 子 集 加 起 
oe t 

假设 $ 可 满足 ， 如 下 构造 S 的 子 集 。 在 满足 赋值 中 ， 如 果 ri 赋值 TRUE， 则 选择 y;; 
如 果 x; 赋值 FALSE， 则 选择 xz;。 如 果 把 已 经 选择 的 数 加 起 来 ， 则 头 /位 的 每 一 位 都 是 1， 
因为 对 每 个 i 都 选择 了 y; 或 者 z;。 而 且 ， 后 位 的 每 一 位 都 介 于 1 和 3 之 间 ， 因 为 每 个 子 
句 都 被 满足 ， 所 以 包含 1 一 3 个 真 文字 。 进 一 步 选 择 足 够 的 g 和 hh ， 使 得 后 位 的 每 一 位 都 
加 到 3， 从 而 达到 目标 值 。 

设 S 的 一 个 子 集 加 起 来 等 于 上 。 在 注意 观察 之 后 ， 构 造 一 个 p 的 满足 赋值 。 首 先 ，S 
中 的 成 员 的 所 有 位 都 是 0 或 1。 其 次 ， 表 中 描述 S 的 每 一 列 最 多 包含 五 个 1。 因 此 当 S 的 
某 个 子 集 相 加 时 ， 不 会 有 到 下 一 列 的 进位 。 为 了 在 头 1 列 的 每 一 列 都 得 到 1， 子 集 对 每 个 i 
都 必须 包含 y; 或 者 z;， 但 又 不 能 同时 包含 二 者 。 

现在 构造 满足 赋值 。 如 果子 集 包 含 y;， 就 赋 zi 为 TRUE， 否 则 赋 它 为 FALSE。 该 赋 
值 肯定 满足 %， 因 为 后 & 列 的 每 一 列 之 和 总 是 3。 在 c 列 ，g; Mh; 最 多 提供 2， 所 以 子 集 
中 的 y; 或 者 xz; 在 该 列 必须 至 少 提供 1。 如 果 是 六， 那么 x; 出 现在 cj 中 而 且 赋 值 为 
TRUE, PRU cj 被 满足 。 如 果 是 z;， 那 么 xz; 出 现在 c; 中 而 且 zi 赋 为 FALSE， 所 以 c; 也 
被 满足 。 因 此 y 被 满足 。 

最 后 ， 必 须 保证 该 归 约 可 以 在 多 项 式 时 间 内 完成 。 表 的 尺寸 大 约 是 (k 十 1)?， 每 一 格 


的 内 容 都 可 以 从 任何 g 中 轻易 地 计算 出 来 。 所 以 全 部 时 间 是 On) 个 简单 步骤 。 s 
练习 
7.1 下 面 各 项 是 真是 假 ? 
a. 2n=O(n) b. n? = O(n) 
Ac. n? =O(nlog? n) Ad. nlogn= O(n) 
e. 37=200") f. 22° 一 O(22 ) 
7.2 下 面 各 项 是 真是 假 ? 
a. n=o(2n) b. 2n=o0(n?) 
Ac, 2n=0(3") Ad. 1=o0(n) 
e. n= 0(logn) f. 1=o(1/n) 
7.3 下 面 哪 一 对 数 是 互 素 的 ? 写 出 求 得 结论 的 演算 过 程 。 
a. 1274 和 10 505 b. 7289 和 8029 
7.4 HFFS w= baba 和 下 面 的 文法 CFG G， 试 填写 定理 7. 14 中 识别 上 下 文 无 关 语 言 的 多 项 式 时 间 
算法 中 所 描绘 的 表 : 
SRT 
RTR | a 


i-©TR | b 
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下 面 的 公式 是 可 满足 的 吗 ? 
CZVy) AGCzZVT7) 人 (元 Vy) 人 (元 V y) 
证 明 P 在 并 、 连 接 和 补 运算 下 封闭 。 
证 明 NP 在 并 和 连接 运算 下 封闭 。 
令 CONNECTED={((c)1G 是 连通 的 无 向 图 } 。 分 析 3. 3. 2 节 给 出 的 算法 ， 证 明 此 语言 属于 P。 
无 向 图 中 的 三 角形 (triangle) 是 一 个 3- 团 。 证明 TRIANGLEEP, 其 中 TRIANGLE={(G)|G 
AAa—-T=AB}. 
证 明 ALLprFA 属 于 P. 
分 析 你 的 算法 的 时 间 复 杂 度 。 
a. WEAR EQpra EP. 
b. 对 语言 A， 如 果 A=A* ， 则 称 A 是 星 闭 的 《star-closed)。 给 出 测试 一 个 DFA 是 否 识 别 一 个 
星 闭 的 语言 的 多 项 式 时 间 算 法 。( 注 意 : EQNFA 属 于 P HRM.) 
SBA G 的 结 点 重新 排序 后 ，G 可 以 变 得 与 互 完全 相同 ， 则 称 G 与 五 是 同 构 的 〈isomorphic) 。 令 
ISO={(G,H)|G M H 是 同 构 的 图 } 。 证 明 TSOE NP. 


这 是 个 研究 化 简 (resolution) 的 问题 。 化 简 是 证 明 cnf 公式 不 可 满足 性 的 一 种 方法 。 令 4=C A 
Cz 人 … 人 Cn 是 一 个 cnf 公式 ，Ci ERTA. $ C=C ICG 是 $$ 的 子 句 }。 每 一 步 化 简 都 在 C 中 
取 两 个 子 句 Ca 和 Cs ， 它 们 有 相同 的 变量 z， 在 一 个 子 句 中 为 zx， 另 一 个 中 为 未 。 例 如 Ca =Car V 
yi Vy VeV yM C =V za Vz VeV), HP y: Me: 都 是 文字 。 我 们 构成 一 个 新 的 子 句 
Cy Vy Ver VorVzr Ve2Ve Ver) 并 去 掉 重 复 的 文字 。 将 新 的 子 句 添加 进 C 中。 重复 化 简 步 
又 ， 直 到 不 再 有 新 的 子 句 产生 。 如 果 C 中 有 空子 句 ()， 则 说 明 4 是 不 可 满足 的 。 

如 果 该 化 简 方法 不 会 将 可 满足 的 公式 误 判 为 不 可 满足 的 ， 则 称 其 为 正确 的 (sound)。 如 果 
该 化 简 方 法 一 定 会 将 不 可 满足 的 公式 判 为 不 可 满足 的 ， 则 称 其 为 完备 的 〈complete) 。 
a. 证 明 该 化 简 方 法 是 正确 且 完 备 的 。 
b. 使 用 (a) 部 分 证 明 2SATEP。 
证 明 PP 在 同 态 下 封闭 当 且 仅 当 P= NP，。 
设 AC1l* 是 任意 一 元 语言 。 证 明 : 者 A 是 NP 完全 的 ， 那么 P= 一 NP。( 提 示 : 考虑 从 SAT BA 
的 多 项 式 时 间 归 约 f。 对 公式 gp, S poo NK p PEE T, t2, z3 和 x4 分 别 置 为 0，1，0 和 0 
后 的 归 约 公式 。 对 指数 多 个 归 约 公式 运用 f 会 发 生 怎样 的 情况 ?) 
在 有 向 图 中 ， 一 个 结 点 的 入 度 Cindegree) 为 所 有 射 人 边 的 总 数 ， 出 度 〈outdegree) 为 所 有 射出 边 
的 总 数 。 证 明 如 下 问题 是 NP 完全 的 。 给 定 一 个 无 向 图 G 和 一 个 G 结 点 的 子 集 C， 是 否 可 以 通过 给 
G 的 每 条 边 赋予 方向 ， 将 G 转换 为 一 个 有 向 图 并 且 满 足 属 于 C 的 结 点 的 人 度 或 出 度 为 0， 不 属于 C 
的 结 点 的 人 度 至 少 为 1? 
如 果 一 个 正则 表达 式 不 含 * 运算 ， 则 称 为 无 * 的 〈star-free) 。 令 EQsprex={(R,S)|RAS 是 等 
价 的 无 * 正 则 表达 式 }。 证 明 EQsFREx 在 coNP 中 。 为 何 这 个 证 明 不 能 用 于 通常 的 正则 表达 式 ? 
差 层 次 (difference hierarchy) D;P 递归 定义 如 下 : 
a. D P=NP., 


b. D;P={A|A=B\C,B 属于 NP,C 属 于 D;_1P)。( 这 里 B\C=BNC.) 

例如 ，DzP 中 的 一 个 语言 是 两 个 NP 语言 的 差 。 有 时 DP HA DP (也 可 以 写成 DIE)。 令 
Z={(G; ski „G2 »k2)|Gi Æ ki- HEG: 没有 k2- 团 )} 

证 明 Z 对 DP 是 完全 的 。 换 言 之 ,证明 ZADP HHE DP 中 的 每 个 语言 多 项 式 时 间 可 归 约 到 Z。 

令 MAX-CLIQUE = ((G,k)|G 中 最 大 团 的 大 小 恰好 为 &}。 利 用 问题 7.18 的 结果 证 明 MAX-CLIQUE 
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是 DP 完全 的 。 
令 f: NON 为 任意 f(n) 二 oln logn) 的 函数 。 证 明 TIME(f(n)) 中 只 含有 正则 语言 。 
如 果 两 个 布尔 公式 有 相同 的 变量 集 且 有 同样 的 满足 赋值 集 ( 就 是 说 它们 描述 了 同样 的 布尔 功 
能 )， 则 称 它们 等 价 (equivalent)。 最 小 布尔 公式 是 指 没 有 上 比 它 更 短 的 等 价 公 式 。 令 MIN-FOR- 
MULA 是 最 新 布尔 公式 集 。 证 明 : 如 果 PNP, M MINFORMULAEP, 
修改 定理 7. 14 的 证 明 中 识别 上 下 文 无 关 语言 的 算法 ， 给 出 一 个 多 项 式 时 间 算 法 ， 使 它 在 输入 一 
个 字符 串 和 一 个 CFG 时 ， 若 该 文法 生成 该 字符 串 ， 则 它 能 产生 该 字符 串 的 语法 分 析 树 。 
对 于 一 个 含有 六 个 变量 及 < 个 子 句 的 cnf 公式 ， 证 明 可 在 多 项 式 时 间 内 构造 一 个 有 O (om) 个 状 
态 的 NFA， 它 接受 所 有 用 长 度 为 m 的 布尔 串 表示 的 不 满足 赋值 。 得 出 结论 : 最 小 化 NFA 的 问 
题 无 法 在 多 项 式 时 间 内 解决 ， 除 非 P= NP。 
2cnf 公式 是 子 句 的 AND， 其 中 每 个 子 句 是 至 多 两 个 文字 的 OR。 令 2SAT=={(8) |p 是 可 满足 的 
2cnf 公式 }。 证 明 2SATEP。 
考虑 下 面 的 算法 MINIMIZE, 以 DFA M 为 输入 ， 输 出 DFA M : 
MINIMIZE= “HA (M), 其 中 M=(Q,3,6,q,,A) 是 DFA: 
1. 把 M 的 从 起 始 状态 出 发 不 可 达 的 状态 全 部 删除 。 
. 以 M 的 状态 为 结 点 ， 构 造 下 面 的 无 向 图 C。 
. 在 G 中 的 每 一 个 接受 状态 和 每 一 个 非 接受 状态 之 间 连 一 条 边 。 另 外 如 下 添加 补充 的 边 。 
. 反复 执行 下 面 的 步 又 ， 直 到 G 中 无 新 边 加 入 为 止 : 
对 于 M 中 每 一 对 不 同 的 状态 go Mr 以 及 每 一 个 cEZ: 
如 果 (6(g,a)，6(r,a)) 是 G 的 一 条 边 ， 就 把 边 (gq, r) 加 入 G 中 。 
. 对 于 每 个 状态 g, > [Lg] 代表 状态 的 集合 : [qj 二 {rE Qlg 和 > 在 G PLUME). 
. 形成 一 个 新 的 DFA M =(Q ,38 ,9qo,4)， 其 中 Q=([qjloEQ}，( 若 alir], WFR 
保留 其 中 一 个 ); 对 每 个 g€Q 和 a€5 有 5 Cala =La]; qo 二 [qo], A =={[gjlg€A}。 
9. 输出 M)” 
a. WEAR M 与 M 等 价 。 
b. 证 明 M 极 小 ， 即 没有 更 少 状态 的 DFA 能 识别 同样 的 语言 。 可 以 无 须 证 明 就 使 用 问题 1. 48 的 
结果 。 
c. 证 明 MINIMIZE 在 多 项 式 时 间 内 运行 。 
在 库 克 - 列 文 定理 的 证 明 中 ， 定 义 窗口 为 单元 的 2X3 和 矩形。 说 明 如 果 换 用 2X2 的 窗口 ， 为 什么 
会 使 证 明 失 效 。 
这 个 问题 来 源 于 单 人 游戏 “扫雷 *， 并 归结 到 图 。 令 G 是 一 个 无 向 图 ， 它 的 每 个 结 点 要 么 有 一 个 
隐藏 的 雷 ， 要 么 是 空 的 。 游 戏 者 一 个 一 个 地 选择 结 点 。 如 果 游 戏 者 选择 了 有 雷 的 结 点 ， 则 失败 。 
如 果 选 择 了 一 个 空 结 点 ， 则 可 以 知道 该 结 点 的 相 邻 结 点 中 共有 多 少 雷 。( 相 邻 结 点 即 同 该 结 点 有 
边 相 连接 的 结 点 。) 如果 所 有 的 空 结 点 都 被 选中 了 ， 则 游戏 者 获胜 。 
K Gh) 雷 相连 问题 是 一 个 图 ， 图 中 的 有 些 结 点 上 标记 了 数字 。 标 记 了 数字 m 的 结 点 v R 
示 它 的 相 邻 结 点 中 有 个 有 雷 ， 我 们 可 以 据 此 判定 其 他 结 点 中 是 否 有 雷 。 将 此 问题 形式 化 为 一 
个 语言 ， 并 证 明 它 是 NP 完全 的 。 
在 宝石 游戏 中 ， 有 一 个 mXm 格 的 棋盘 。 在 它 的 m? 个 格子 中 ， 每 个 位 置 要 么 放 蓝 色 棋 子 ， 要 么 
放 红 色 棋 子 ， 要 么 什么 也 不 放 。 通 过 去 掉 棋 子 使 得 每 一 列 都 只 有 一 种 颜色 的 棋子 ， 每 一 行 都 至 
少 有 一 个 棋子 ， 达 到 此 目标 则 获胜 。 是 否 能 够 获胜 取决 于 初始 布局 。 令 SOLITAIRE={(G)|G 
为 可 获胜 的 游戏 布局 } 。 证 明 SOLITAIRE 为 NP 完全 的 。 
令 SET-SPLITTING={(S,C)|S 是 一 个 有 穷 集 ,C= 二 {C1,…,Cr) 是 由 S 的 某 些 子 集 组 成 的 集 
A, k>0, E4 S 的 元 素 可 以 被 染 为 红色 或 蓝 色 ， 而 且 对 所 有 Cis Ci 中 的 元 素 不 会 被 染 成 同一 
种 颜色 }。 证 明 SET-SPLITTING 是 NP 完全 的 。 
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思考 下 述 计 划 安 排 问题 。 有 一 份 期 末 考 试 清 单 Flo Fi 需要 安排 时 间 ， 学 生 清单 S ,…，S,。 
每 个 学 生 都 选择 了 这 些 考试 的 某 个 子 集 。 必 须 将 这 些 考 试 安排 到 各 时 段 中 ， 使 得 同一 时 段 中 不 
会 有 某 个 学 生 同 时 需要 参加 两 门 考 试 。 试 问 ， 如 果 只 用 hh 个 时 段 ， 是否 存在 合乎 要 求 的 计划 。 
将 这 个 问题 形式 化 为 一 个 语言 ， 并 证 明 它 是 NP 完全 的 。 
回忆 一 下 ， 在 关于 顾 奇 -图 灵 论 题 的 讨论 中 ， 介绍 了 语言 D={(p)] p 是 有 一 个 整数 根 的 多 变量 
多 项 式 }。 称 D 是 不 可 判定 的 ,但 没有 给 出 证 明 。 在 本 问题 中 要 证 明 D 的 另 一 个 性 质 ， 即 DD 是 
NP 难 (NP-hard) 的 。 一 个 问题 是 NP 难 的 ， 如 果 NP 中 的 所 有 问题 都 多 项 式 时 间 可 归 约 到 它 ， 
虽然 它 自己 可 能 不 在 NP 中 。 必 须 证 明 NP 中 的 所 有 问题 都 多 项 式 时 间 可 归 约 到 D. 
如 果 图 G 中 有 某 个 结 点 子 集 ， 其 他 结 点 都 至 少 与 该 子 集中 的 某 一 结 点 相 邻 ， 则 该 子 集 称 为 支配 
集 (dominating set), 4 

DOMINATING-SET={{G,k) |G 有 一 个 包含 上 个 结 点 的 支配 集 )} 
通过 从 VERTEX-COVER 问题 归 约 到 此 问题 来 证 明 它 是 NP 完全 的 。 
证 明 下 述 问题 是 NP 完全 的 。 设 有 状态 集 Q= 二 {gq6 ,gj，…,g,) 以 及 配对 组 合集 (Csi snd, 
(sored), EPs, 是 5 二 {0,1)} 上 的 不 重复 的 字 串 ，r; 是 Q 的 成 员 〈 可 以 重复 ) 。 判 定 是 否 存在 
一 个 DFA M 一 (Q,3,6,go ,F)， 对 每 个 i 都 有 56(go ,si) 二 ri。 这 里 6(g，s) 是 M 在 状态 9 ERS 
Bs 后 进入 的 状态 。( 注 意 下 在 这 里 是 不 相关 的 。) 
令 U=((M, 2x, #') | JPR EMA ROL M 在 至 少 一 个 分 支 上 在 上 步 内 接受 输入 x}。 注 意 并 不 要 求 
M 在 所 有 分 支 上 停机 。 证 明 U 是 NP 完全 的 。 
证 明 : 者 P= 二 NP， 则 任 给 布尔 公式 5， 若 $ 是 可 满足 的 ， 则 存在 多 项 式 时 间 算 法 给 出 一 个 4 的 
满足 赋值 。( 注 意 : 要 求 提供 的 算法 计算 一 个 函数 而 非 若 干 函数 ， 除 非 是 NP 包含 的 语言 。P= 
NP 的 假定 说 明 SAT 在 PP 中， 所 以 其 可 满足 性 的 验证 是 多 项 式 时 间 可 解 的 。 但 是 这 个 假设 没有 
说 明 这 项 验证 如 何 进 行 ， 而 且 验 证 不 能 给 出 满足 赋值 。 必 须 证 明 它们 一 定 能 够 被 找到 。 提 示 : 
重复 地 使 用 可 满足 性 验证 器 一 位 一 位 地 找 出 满足 赋值 。) 
证 明 : 独 P 二 NP， 则 可 以 在 多 项 式 时 间 内 将 整数 因子 分 解 。( 参 见 问题 7. 35 的 提示 。) 

证 明 : 者 P= 二 NP， 则 可 以 在 多 项 式 时 间 内 找 出 无 向 图 中 的 最 大 团 。( 参 见 问题 7. 35 的 提示 。) 
图 的 一 个 着 色 (Coloring) 是 给 结 点 指定 颜色 ， 使 得 相 邻 的 结 点 不 会 被 指定 为 同一 种 颜色 。 令 
3COLOR= {(G) |G 的 结 点 被 三 种 颜色 着 色 ) 

证 明 3COLOR 是 NP 完全 的 。( 提 示 : 利用 下 面 三 个 子 图 .) 
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调 色 板 变量 OR 构件 
有 一 个 盒子 和 一 些 卡 片 ， 如 下 图 所 示 。 盒 子 里 有 栓塞 ， 卡 片上 有 止 口 ， 所 以 每 张 卡 片 可 以 两 种 方式 
放 人 盒子 中 。 每 张 卡片 上 有 两 排 孔 ， 有 些 孔 没有 打 穿 。 把 所 有 卡片 放 进 盒子 ， 使 得 盒子 的 底 被 完全 
覆盖 〈 即 ， 每 个 孔 的 位 置 都 被 至 少 一 张 在 该 位 置 上 无 孔 的 卡片 堵 住 )， 则 谜 题 就 算 破 解 了 。 令 
PUZZLE= {(c 5°", EA ci 代表 一 张 卡片 ,并 且 这 个 卡片 集 有 人 解 } 
证 明 PUZZLE 是 NP 完全 的 。 
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4 
MODEXP= {(a,b,c,p) a,b,c, p Æ ZH t BR, a’ =c(mod p)} 
证 明 MODEXPEP。( 注 意 ， 最 明显 的 算法 不 在 多 项 式 时 间 内 运行 。 提 示 : 先 试 证 是 2 的 项 的 
情况 .) 
集合 {(1，…，R&} 上 的 一 个 置换 (permutation) 是 一 个 在 这 个 集合 上 的 一 对 一 的 映射 函数 。 令 pp 
为 一 个 置换 ，p! 表示 p 自身 的 t 次 复合 。 令 
PERM-POWER 二 {1(p,q,t)|p 二 gq'， 其 中 pp 和 9g 为 {1,…,k) 上 的 置换 ,t 是 二 进 制 整 数 ) 
证 明 PERM-POWER EP。( 注 意 ， 最 明显 的 算法 不 在 多 项 式 时 间 内 运行 。 提 示 : 先 试 证 + 是 2 
EA) Fe AY) TL.) 
证 明 PHB SIR PHA. Ger: 使 用 动态 规划 。 对 于 任意 的 AEP， 对 输入 y= yt yn E 
中 y; E53， 建 一 个 表 ， 表 示 对 于 每 个 i<j, BRATS yi*…y; EA* 。) 
证 明 NP 在 星 号 运算 下 封闭 。 
& UNARY-SSUM 是 所 有 数 用 一 进 制 表示 的 子 集 和 问题 。 为 什么 SUBSET-SUM 的 NP 完全 性 
的 证 明 不 能 用 来 证 明 UNARY-SSUM 是 NP 完全 的 ? 求证 UNARY-SSUMEP, 
证 明 若 P=NP， 则 除了 语言 A=OMA=>* 以 外 ， 所 有 语言 AEP 都 是 NP 完全 的 。 
证 明 PRIMES=({m|m 是 二 进 制 表 示 的 素数 )ENP。 ATR: 对 于 pol, RAR Zi 一 (x | x 与 
pHR, Hl<z<p) 是 p 一 1 阶 循环 群 当 且 仅 当 p 是 素数 。 可 以 利用 这 一 事实 ， 无须 证 明 。 现 
在 已 知 PRIMESEP 为 真 ， 但 其 证 明 更 难 。) 
一 般 认 为 PATH 不 是 NP 完全 的 ， 请 说 明 原 因 。 证 明 如 果 PATH 不 是 NP 完全 的 ， 则 PANP. 
设 G 表示 无 向 图 , $ 
SPATH=({(G,a,b,k)|GRKa 到 65、 长 度 至 多 为 的 简单 路 径 } 
以 及 
LPATH 二 {(G,a,b,k)|G 包含 从 a 到 5 长 度 至 少 为 的 简单 路 径 } 
a. 证 明 SPATHEP., 
b. 证 明 LPATH 是 NP 完全 的 。 
令 DOUBLE-SAT = {(4)|$ 至少 有 两 个 满足 赋值 } 。 证 明 DOUBLE-SAT 是 NP 完全 的 。 
令 HALF-CLIQUE 二 {4(G)1G 是 无 向 图 ,包含 结 点 数 至 少 为 m/2 的 完全 子 图 ,m 是 G HAAR. 
证 明 HALF-CLIQUE 是 NP 完全 的 。 
S CNF,={(¢)|¢ 是 一 个 可 满足 的 cnf 公式 ， 其 中 每 个 变量 最 多 出 现在 个 位 置 }。 
a. 证 明 CNF: €P. 
b. 证 明 CNF; 是 NP 完全 的 。 
& CNFu= { (p) | $$ 是 一 个 可 满足 的 cnf 公式 ， 其 中 每 个 子 句 包含 任意 多 个 文字 ， 但 最 多 只 有 
一 个 文字 的 非 )。 证 明 CNFn EP. 
设 g E 3cnf 公式。 变量 SWAMI (assignment) 是 使 每 个 子 句 包含 两 个 不 同 真 值 的 文字 的 赋 
值 。 换 言 之 ， 关 一 赋值 满足 $4， 而 又 不 在 任何 子 句 中 赋值 三 个 真 文字 。 
a. 证 明 g 的 任何 关 一 赋值 的 否定 依然 是 了 冯 一 赋值 。 
b. 邻 取 SAT 是 具有 关 一 赋值 的 3cnf 公式 的 集合 。 证 明 : 通过 把 每 个 子 句 ci 
(y1Vy2 Vy3) 
换 成 两 个 子 句 
(yi V yo V zi) M Cz: V y3 Vo) 

其 中 z; 是 对 应 于 每 个 子 句 c; 的 新 变量 ,6 是 一 个 补充 的 新 变量 ， 可 以 得 到 从 3SAT BASAT 

的 多 项 式 时 间 归 纳 。 
c BASAT 是 NP 完全 的 结论 。 
无 向 图 的 一 个 割 Cud 是 把 顶点 集 V 分 裂 成 两 个 不 相交 的 子 集 S 和 了 工 。 割 的 规模 是 一 端 在 SH, 
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另 一 端 在 工 中 的 边 的 数目 。 令 

MAX-CUT={{G,k)|G 有 规模 不 少 于 & 的 割 } 
证 明 MAX-CUT 是 NP 完全 的 。 可 以 假定 问题 7. 53 的 结论 成 立 。 (提示 : 证 明天 SAT 委 ，MAX- 
CUT 。 对 应 变量 r 的 构件 是 由 3c 个 标记 为 xz 的 结 点 和 3c 个 标记 为 的 结 点 组 成 的 集合 ， 这 里 < 
是 子 句 数 。 所 有 标记 为 z 的 结 点 都 与 所 有 标记 为 二 的 结 点 相连 。 子 句 构件 是 由 三 条 边 组 成 的 三 
角形 ， 这 三 条 边 连接 三 个 由 该 子 句 中 的 文字 做 标记 的 结 点 。 不 同 的 子 句 构件 采用 不 同 的 结 点 。 
证 明 这 种 归 约 满足 要 求 。) 


习题 选 解 
a | Cc. {ER ; d. EH. 
7.2 « HB; d R, 


7.28 首先 ， 可 以 在 多 项 式 时 间 内 验证 一 种 方案 是 否 有 效 ， 所 以 SOLITAIRE ENP。 其 次 , 证 明 3SAT <p 


7. 43 


7. 50 


SOLITAIRE, 给 定 一 个 $5， 有 m 个 变量 zx1，zx2z，…，zm 和 有 个 子 句 cl，cz ，…，ck， 构 造 一 个 
&X 的 游戏 G。 假 定 $ 中 没有 子 句 同时 含有 xz; 和 zi， 因 为 去 掉 这 种 子 句 不 会 影响 可 满足 性 。 

如 果 zi 在 子 句 cj 中 ， 就 放 一 枚 蓝 色 棋 子 在 cj 行 zx; Wh. MRF Ac; 中 ， 就 放 一 枚 红色 
棋子 在 cj 行 x; 列 上 。 如 有 必要 ， 可 以 通过 复制 行 或 添加 空 列 使 棋盘 保持 正方 而 不 影响 可 解 性 。 可 
以 证 明 ，$ 可 满足 当 且 仅 当 G 可 解 (获胜 )。 

(>) 车 $ 可 满足 。z; 为 真 〈 假 )， 从 相应 列 中 移 去 红色 KA) 棋子 。 现 在 ， 棋 子 对 应 着 取 
值 为 真 的 文字 。 因 为 所 有 子 句 都 有 一 个 取 值 为 真 的 文字 ， 所 以 所 有 行 都 有 棋子 。 

(<) 若 游 戏 可 解 GRAD). WRENN PHA Re) 棋子 被 移 去 ， 将 相应 的 变量 置 为 真 
( 假 ) 。 每 行 都 有 棋子 留 下 ， 所 以 每 个 子 句 都 至 少 有 一 个 为 真 的 文字 。 因 此 p 被 满足 。 
假设 P= 二 NP， 则 CLIQUEE P， 且 对 于 任意 的 &， 可 在 多 项 式 时 间 内 检测 G 是 否 有 一 个 且 团 。 一 一 
检测 G 中 是 否 有 k& 规模 的 团 , & 从 1 取 到 G 的 结 点 总 数 ， 就 可 以 在 多 项 式 时 间 内 找 出 G 中 最 大 团 
的 规模 1:。 一 旦 知道 了 +1， 就 可 按 下 述 方法 找 出 一 个 含有 t 个 结 点 的 团 。 对 G 的 每 个 结 点 z， 移 去 工 
并 重新 计算 最 大 团 的 规模 。 如 果 规 模 减 小 了 ， 恢 复 z 继续 测试 下 一 个 结 点 。 所 有 结 点 都 这 样 处 理 
一 遍 后 ， 剩 下 的 结 点 就 是 要 求 的 上 团 。 
令 AENP。 构 造 非 确 定型 图 灵机 M 在 非 确定 的 多 项 式 时 间 内 判定 A* 。 
M 一 “对 于 输入 w: 

1. 非 确定 地 将 w DRAA THE wS Taro 

2. 对 每 一 x;， 非 确定 地 猜测 可 证 明 r: CA 的 证 书 。 

3. 验证 所 有 可 能 的 证 书 ， 然 后 接受 。 

如 验证 失败 ， 则 拒绝 。” 

我 们 给 出 一 个 从 CLIQUE 到 HALF-CLIQUE 的 多 项 式 时 间 映 射 归 约 。 该 归 约 的 输入 是 G, k) 
对 ， 归 约 产生 图 (H) FARM, HH 互 描 述 如 下 。 若 G 有 头 个 结 点 且 & 有 = 二 m/2， 则 H=G. # 
k<m/2, Wi G 中 添加 7 个 结 点 〈 每 个 都 和 原 有 结 点 连接 且 彼 此 连接 ) 得 到 H, 其 中 jm k. 
这 样 互 就 含有 思 十 7 一 2m 一 2 个 结 点 。 显 然 ，G 有 有 &- 团 当 且 仅 当 互 有 规模 为 上 十 1 一头 一 & 的 团 。 
所 以 (G,k) E CLIQUE 的 当 且 仅 当 《〈 互 )E HALFCLIQUE, WẸ k>m/2, WE G 中 添加 j 个 结 
点 但 不 添加 任何 边 得 到 态 ， 其 中 j= 二 2k 一 m。 这 样 且 有 m 十 j 二 2 个 结 点 ， 因 此 G 有 姑 团 当 且 仅 当 
H A kB. MA (G,k) E CLIQUE 当 且 仅 当 〈 互 )E HALF-CLIQUE。 还 需要 证 明 HALF 
CLIQUEENP。 证 书 很 简单 ， 就 是 那个 团 。 
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空间 复杂 性 





本 章 从 计算 问题 所 需要 的 空间 大 小 〈 存 储量 ) 出 发 考察 其 复杂 性 。 在 寻找 许多 计算 问 
题 的 可 行 解 时 ， 时 间 和 空间 是 最 重要 的 两 个 需要 衡量 的 因素 。 空 间 复杂 性 与 时 间 复 杂 性 有 
许多 相似 之 处 ， 它 为 按照 计算 难度 来 更 深入 地 研究 问题 的 分 类 提供 了 另外 一 种 方法 。 

与 分 析 时 间 复 杂 性 类 似 ， 首 先 需要 选择 一 个 模型 来 度量 算法 所 消耗 的 空间 。 本 章 仍 采 
用 图 灵机 模型 ， 因 为 其 数学 形式 简单 ， 而 且 近 似 实际 的 计算 机 ， 足 以 得 出 有 意义 的 结果 。 

(EAI 邻 M 是 一 个 在 所 有 输入 上 都 停机 的 确定 型 图 灵机 。M 的 空间 复杂 度 
(space complexity) 是 一 个 函数 f:N-N, HP fin) 是 M 在 任何 长 为 n 的 输入 上 扫描 带 
子 方 格 的 最 大 数 。 若 M 的 空间 复杂 度 为 f(n)， 则 称 M 在 空间 Sf 内 运行 。 

如 果 M 是 对 所 有 输入 在 所 有 分 支 上 都 停机 的 非 确定 型 图 灵机 ， 则 将 它 的 空间 复杂 度 
Fo) 定义 为 M 对 任何 长 为 n 的 输入 ， 在 任何 计算 分 支 上 所 扫描 的 带子 方 格 的 最 大 数 。 

与 时 间 复 杂 度 类 似 ， 通 常用 渐 近 记 法 估计 图 灵机 的 空间 复杂 度 。 

A f:N>R 是 一 个 函数 。 空 间 复 杂 性 类 (space complexity class) SPACE(f(n)) 
和 NSPACE(f(n)) 定义 如 下 : 

SPACE(f(n)) =({L|IL 是 被 O(f m) 空间 的 确定 型 图 灵机 判定 的 语言 

NSPACE( f(n)) ={L|L 是 被 O(f(n)) 空间 的 非 确定 型 图 灵机 判定 的 语言 ) 

第 7 章 介 绍 了 NP 完全 问题 SAT， 现 在 证 明 用 线性 空间 算法 能 求解 SAT 问 
题 。 因 为 SAT 是 NP 完全 的 ， 所 以 SAT 不 能 用 多 项 式 时 间 算 法 求解 ， 更 不 能 用 线性 时 间 
算法 求解 。 因 为 空间 可 以 重用 ， 而 时 间 不 能 ， 所 以 空间 的 能 力 显得 比 时 间 强 得 多 。 

M,=“xtBA (6), 6 是 布尔 公式 ，; 

1. 对 于 中 变量 x1,… ,zm 的 每 个 真 值 赋值 ; 
2. 计算 y 在 该 真 值 赋 值 下 的 值 。 
3. Æ p 的 值 为 1， 则 接受 ; 否则 拒绝 。” 

显然 机 器 Mi 是 在 线性 空间 内 运行 ， 因 为 每 一 次 循环 都 可 以 复 用 带子 上 的 同一 部 分 。 
该 机 器 只 需 存储 当前 的 真 值 赋值 ， 这 只 需要 消耗 O(m) 空间 。 因 为 变量 数 m 最 多 等 于 输 
入 长 度 n， 所 以 该 机 器 在 空间 O(n) 内 运行 。 e 

(0 这 个 例子 分 析 了 一 个 语言 的 非 确定 性 空间 复杂 性 。 在 下 一 节 将 说 明 ， 测 定 
非 确定 性 空间 复杂 性 ， 对 于 测定 它 的 确定 性 空间 复杂 性 是 有 很 大 帮助 的 。 下 面 分 析 判 定 一 
个 非 确定 型 有 穷 自 动机 是 否 接受 所 有 字符 串 的 问题 。 令 

ALLnra = (KA?) | A E-A NFA H L(A)= 3” } 

首先 给 出 一 个 非 确定 型 线性 空间 算法 来 判定 该 语言 的 补 ALLNFA 。 算 法 的 思想 是 利用 
非 确定 性 猜测 一 个 被 NFA 拒绝 的 字符 串 ， 然 后 用 线性 空间 跟踪 该 NFA， 看 它 在 特定 时 刻 
会 处 在 什么 状态 。 需 要 注意 的 是 ， 此 时 还 不 知道 该 语言 是 否 在 NP 或 coNP 中 。 

N= 二 “对 于 输入 (M), M#—% NEA: 
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. 置 标记 于 NFA 的 起 始 状 态 。 
. 重复 执行 下 面 的 语句 2? 次 ， 这 里 是 M 的 状态 数 : 

非 确定 地 选择 一 个 输入 符号 并 移动 标记 到 M 的 相应 状态 ， 来 模拟 读 取 那个 符号 。 
如 果 步 又 2 和 3 表明 M 拒绝 某 些 字 符 串 ， 即 如 果 在 某 一 时 刻 所 有 标记 都 不 落 
在 M 的 接受 状态 上 ， 则 接受 ; 否则 拒绝 。” 

如 果 M 拒绝 某 个 字符 串 ， 则 它 必定 拒绝 一 个 长 度 不 超过 2? 的 字符 串 ， 因 为 在 任何 被 
拒绝 的 更 长 的 字符 串 中 ， 上 面 算法 中 所 描述 的 标记 的 位 置 分 布 必 定 重 复出 现 。 介 于 两 次 重 
复出 现 之 间 的 那 一 段 字 符 串 可 以 删 去 ， 从 而 得 到 更 短 的 被 拒绝 的 字符 串 。 所 以 N 可 判定 
ALLNFA 。( 值 得 注意 的 是 ， 六 也 接受 格式 错误 的 输入 。) 

该 算法 仅 需 要 的 空间 是 用 来 存放 标记 的 位 置 和 重复 计数 器 ， 这 在 线性 空间 就 可 以 得 到 
解决 。 因 此 ， 该 算法 在 非 确定 的 空间 O(n) 内 运行 。 接 下 来 ， 证 明 一 个 关于 ALLNFA 的 确 


上 


定性 空间 复杂 人 性 的 定理 。 = 
8.1 萨 维 奇 定理 


本 节 介 绍 有 关 空 间 复 杂 性 的 最 早 结论 之 一 一 一 萨 维 奇 定 理 。 该 定理 表明 确定 型 机 器 可 
以 用 非常 少 的 空间 模拟 非 确定 型 机 器 。 ETNA 性， 这 种 模拟 似乎 需要 指数 倍 地 增加 
时 间 。 对 于 空间 复杂 性 ， 萨 维 奇 定理 说 明 ， 任 何 消耗 f(n) 空间 的 非 确定 型 图 灵机 都 可 以 
转变 为 仅 消耗 用 (n) 空间 的 确定 型 图 灵机 。 

( 萨 维 奇 定理 ) APRO Be f: NRH, AP fnn, 

NSPACE( f(n)) CS SPACE( f? (n) ) 

证 明 思 路 ”我们 需要 确定 地 模拟 一 个 fn) 空间 的 NTM ( 非 确定 型 图 灵机 )。 最 简单 
的 方法 就 是 逐个 地 尝试 NTM 的 所 有 计算 分 支 。 这 种 模拟 要 求 记录 当前 正在 尝试 的 是 哪 
一 个 分 支 ， 以 便 能 够 过 滤 到 下 一 个 分 支 。 但 是 消耗 f(n) 空间 的 一 个 分 支 可 能 运行 
20(/( 履 步 ， 每 一 步 都 可 能 是 非 确 定 的 选择 。 顺 序 地 考察 每 一 个 分 支 要 求 记 录 某 个 具体 
分 支 上 所 做 的 所 有 选择 ， 以 便 能 找到 下 一 个 分 支 。 所 以 该 方法 可 能 会 用 掉 20‘f 中 空间 ， 
超过 了 On) 空间 。 

考虑 到 更 具 一 般 性 的 问题 ， 这 里 采用 了 另 一 种 不 同 的 方法 。 给 定 NTM 的 两 个 格局 cl 
和 co 以 及 一 个 整数 1:， 要 求 判定 该 NTM 能 否 在 t 步 内 仅 用 f(n) 空间 从 cl 变 到 co, MR 
问题 为 可 产生 性 问题 (yieldability problem). WRS cl 是 起 始 格局 ，c 是 接受 格局 ，t 是 
非 确定 型 机 器 可 以 使 用 的 最 大 步 数 ， 那 么 通过 求解 可 产生 性 问题 ， 就 能 够 判定 机 器 是 否 接 
受 输 入 。 

下 面 给 出 一 个 确定 的 递归 算法 来 求解 可 产生 性 问题 。 它 的 运算 过 程 为 : 寻找 一 个 中 间 
格局 Cms SOHRE cl 能 否 在 t/2 步 内 到 达 ci， 以 及 cm 能 否 在 1/2 步 内 到 达 oo. BRE 
用 两 次 递归 检查 的 空间 即 可 显著 地 节省 空间 开销 。 

该 算法 需要 用 来 存储 递归 栈 的 空间 。 递 归 的 每 一 层 需要 O(f(n)) 空间 来 存储 一 个 格 
局 。 递 归 的 深度 是 log 上 ， 这 里 上 是 非 确定 型 机 器 在 所 有 分 支 上 可 能 消耗 的 最 大 时 间 。 因 为 
t=20 ”， 所 以 logt 二 OC(f(n))。 因 此 确定 的 模拟 过 程 需要 OC f? (n)) 空间 。 


日 在 8.4 节 ， 我 们 证明 只 要 f(n) 宇 logn， 萨 维 奇 定理 就 能 成 立 。 
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证 明 设 NN 是 在 空间 f(n) 内 判定 语言 A 的 NTM。 构造 一 个 判定 A 的 确定 型 图 灵机 
M。 机 器 M 使 用 过 程 CANYIELD， 该 过 程 检查 N 的 一 个 格局 能 否 在 指定 的 步 数 内 产生 为 
一 个 格局 ， 它 求解 了 在 证 明 思 路 中 所 描述 的 可 产生 性 问题 。 

设 己 是 输入 到 N 的 字符 串 。 对 于 N 的 格局 c1 ,cz 以 及 整数 上 (为 方便 ， 假 定 上 是 2 的 
整数 次 窘 )， 如 果 从 格局 cl 出 发 ，N 有 一 系列 非 确 定 的 选择 能 使 它 在 上 步 内 进入 格局 co, 
则 CANYIELD(c) ,cz,t) 输出 接受 ， 否则 ，CANYIELD 输出 拒绝 。 

CANYIELD 王 “对 输入 cl co Alt: 

l. Æ 三 1， 则 直接 检查 是 否 有 cl 一 cz ， 或 者 根据 N 的 规则 检查 cl 能 否 在 一 步 内 
产生 cs 。 如 果 其 中 之 一 成 立 ， 则 接受 ; 如 果 两 种 情况 都 不 成 立 ， 则 拒绝 。 
2. @t>1, WHFN 的 每 一 个 消耗 空间 SO) 的 格局 Cm: 


3. 运行 CANYIELD(c1 FA F) f 


4. 运行 CANYIELD(cn ee a l 


5. ER 3 步 和 第 4 步 都 接受 ， 则 接受 。 
6. 和 在 此 时 还 没有 接受 ， 则 拒绝 。?” 
现在 定义 M 来 模拟 N 。 首先 修改 N， 当 它 接受 时 ， 把 带子 清空 并 把 读 写 头 移 到 最 左 
边 的 单元 ， 从 而 进入 称 为 caccept 的 格局 。 令 Carte NEw 上 的 起 始 格 局 。 选 一 个 常数 qd， 
使 得 N 在 f(n) 带子 上 的 格局 数 不 超 过 24% ， 其 中 是 w 的 长 度 。2” ”是 NN 在 所 有 分 
支 上 的 运行 时 间 的 上 界 。 
M 一 “对 输入 w: 
1. 输出 GANYIELD CCstart »Caccept »2“/°” ) 的 结果 。” 
算法 CANYIELD 显然 求解 了 可 产生 性 问题 。 因 此 M 正确 地 模拟 了 NN 。 下 面 需 要 分 析 
M, 确信 它 在 OCF? (n)) 空间 内 运行 。 
CANYIELD 在 递归 调用 自己 时 ， 它 把 所 处 的 步骤 号 以 及 cl co 和 + 上 的 值 都 存储 在 栈 
中 ， 所 以 递归 调用 返回 时 能 够 恢复 这 些 值 。 因 此 在 递归 的 每 一 层 需要 增加 O(f(n)) 空间 。 
此 外 , 递归 的 每 一 层 把 土 的 值 减 小 一 半 。 开 始 时 上 等 于 24 ， 所 以 递归 的 深度 是 
Oog? ™) 或 OC(fl(n))。 因 此 总 共 消 耗 的 空间 是 O(CP(z))， 正 如 断言 所 述 。 
在 这 个 论证 过 程 中 产生 了 一 个 技术 难点 ， 其 原因 是 算法 M 在 调用 CANYIELD 时 需 
要 知道 f(n) 的 值 。 修 改 M 可 以 克服 这 个 困难 ， 方 法 是 对 fl(n) 不 断 赋 值 使 fC) =1,2, 
3,… 。 对 于 每 个 值 f(n) 二 1:， 修 改 后 的 算法 利用 GANYIELD 来 确定 接受 格局 是 否 可 达 。 
此 外 ， 利 用 该 过 程 ， 还 可 通过 检查 N 能 否 从 起 始 格 局 出 发 到 达 某 个 长 度 为 i 十 1 的 格局 来 
确定 N 是 否 至 少 需 要 i 十 1 大 小 空间 。 如 果 接 受 格局 可 达 ， 则 M 接受 ; 如 果 没 有 长 为 i 十 1 
的 格局 可 达 ，M 拒绝 ;否则 M 继续 尝试 f(n)= 二 i 十 1。( 也 可 以 用 另 一 种 办 法 来 克服 这 个 困 
难 ， 即 假定 M 能 在 空间 OC(f(n))〉 内 计算 出 f), 但 是 那样 就 需要 把 这 个 假定 加 入 定理 的 
陈述 中 ,) it 


8.2 PSPACE 类 


与 定义 了 类 相似 ， 我 们 为 空间 复杂 性 定义 PSPACE 类 。 
PSPACE 是 在 确定 型 图 灵机 上 、 在 多 项 式 空 间 内 可 判定 的 语言 


Di 
N 
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PSPACE =U SPACE(n* ) 
k 


PSPACE 类 的 非 确 定型 版 本 NPSPACE 可 以 类 似 地 用 NSPACE 类 来 定义 。 然 而 ， 任 
何 多 项 式 的 平方 仍 是 多 项 式 ， 根 据 陕 维 奇 定 理 ，NPSPACE 王 PSPACE。 

在 例 8. 3 和 例 8.4 中 , 已 经 说 明了 SAT 属于 SPACE(n), ALLyra JB coNSPACE(n), 
而 根据 萨 维 奇 定 理 ， 确 定型 空间 复杂 性 类 对 补 运 算 封 闭 ， 所 以 ALLNFA 也 属于 SPACE( ) 。 
因此 SAT 和 ALLNFA 这 两 个 语言 都 在 PSPACE 中 。 

现在 考察 PSPACE 与 P 和 NP 的 关系 。 显 而 易 见 ，PCPSPACE， 因 为 运行 快 的 机 需 
不 可 能 消耗 大 量 的 空间 。 更 精确 地 说 ， 当 zz) 三 时， 由 于 在 每 个 计算 步 上 最 多 能 访问 一 
个 新 单元 ， 因 此 ， 任 何在 时 间 Cn) 内 运行 的 机 器 最 多 能 消耗 tO) 的 空间 。 与 此 类 似 ， 
NPCNPSPACE， 所 以 NPEPSPACE, 

反 过 来 ， 根 据 图 灵机 的 空间 复杂 性 也 可 以 界定 它 的 时 间 复 杂 性 。 对 于 f(n) 宇 rn， 通过 
简单 推广 引 理 5. 7 的 证 明 可 知 ， 一 个 消耗 f(n) 空间 的 图 灵机 至 多 有 f(n)2°U "个 不 同 的 
格局 ， 图 灵机 的 停机 计算 不 能 出 现 重复 格局 。 因 此 消耗 空间 fo) 的 图 灵机 9 必定 在 时 间 
f(n)20UM) 内 运行 ， 得 出 PSPACECEXPTIME= UTIME(2" ) 。 

用 下 面 的 一 系列 包含 式 总 结 迄 今 为 止 所 定义 的 复杂 性 类 之 间 的 关系 : 

PCNPCPSPACE = NPSPACE c EXPTIME 

在 这 些 包 含 式 中 ， 还 不 知道 是 否 有 某 一 
个 为 等 式 。 也 许 有 人 会 发 现 一 个 类 陕 维 奇 定 FXPTIME 
理 的 方法 ， 使 得 这 里 的 某 些 类 能 够 合并 为 一 
个 类 。 但 是 在 第 9 章 将 证 明 PA EXPTIME, © NP 


PSPACE 


所 以 上 面 的 包含 式 中 至 少 有 一 个 是 真 包 含 ， 但 
还 不 能 确定 是 哪 一 个 ! 实际 上 ， 大 部 分 研究 者 
相信 所 有 包含 式 都 是 真 包含 。 图 8- 1 描绘 了 这 
些 类 之 间 的 关系 ， 假 设 所 有 类 是 不 同 的 。 图 8- 1 P、NP、PSPACE 和 EXPTIME 的 推测 关系 


8.3 PSPACE 完全 性 


7.4 节 介绍 了 NP 完全 语言 类 ， 它 代表 NP 中 最 难 的 语言 类 。 证 明 一 个 语言 是 NP H 
全 的 是 说 明 它 不 属于 P 的 强 有 力 的 证 据 。 若 它 属 于 P,， 则 P 将 和 NP 相等 。 本 市 为 
PSPACE 类 引信 一 个 类 似 概念 PSPACE 完全 性 。 

若 语 言 B 满足 下 面 两 个 条 件 ， 则 它 是 PSPACE 完全 的 : 

1. B Æ f PSPACE, 

2. PSPACE 中 的 每 一 个 语言 A 多 项 式 时 间 可 归 约 到 B。 

+ B 只 满足 条 件 2， 则 称 它 为 PSPACE HEA. 

在 定义 PSPACE 完全 性 时 ， 利 用 了 定义 7. 24 中 给 出 的 多 项 式 时 间 可 归 约 性 。 为 什么 
不 定义 并 且 采 用 多 项 式 空间 可 归 约 性 ， 而 用 多 项 式 时 间 可 归 约 性 呢 ? 为 了 理解 这 个 重要 问 
题 的 答案 ， 首 先 考察 定义 完全 问题 的 动机 。 

完全 问题 是 重要 的 ， 因 为 它们 是 复杂 性 类 中 最 困难 问题 的 样 例 。 完 全 问题 是 最 难 的 ， 


O 当 8.4 节 介绍 消耗 亚 线性 空间 的 图 灵机 时 ， 这 里 的 要 求 fd) Sn 被 推广 为 f(n) 之 log n. 


因为 该 类 中 的 其 他 问题 很 容易 归 约 到 它 。 如 果 找 到 一 种 简便 的 方法 求解 完全 问题 ， 就 能 很 
容易 求解 该 类 中 的 其 他 所 有 问题 。 为 了 使 这 种 逻辑 能 够 成 立 ， 相 对 于 该 类 中 典型 问题 的 复 
杂 性 ， 归 约 过 程 就 必须 是 容易 的 。 如 果 归 约 过 程 本 号 就 很 难 算 ， 那 么 针对 完全 问题 的 容易 
解法 就 不 一 定 能 推导 出 其 他 归 约 到 它 的 问题 的 容易 的 解法 。 

所 以 ， 必 须 遵 循 如 下 规则 当 为 一 个 复杂 性 类 定义 完全 问题 时 ， 归 约 的 模型 必须 比 用 
来 定义 类 本 和 号 的 模型 更 加 受 限 。 


8.3.1 TQBF 问题 


PSPACE 完全 问题 的 第 一 个 例子 是 可 满足 性 问题 的 推广 。 回 忆 一 下 ， 布 尔 公 式 是 一 个 
包含 布尔 变量 、 常 数 0 和 1 以 及 布尔 运算 符 八 ，V， 一 的 表达 式 。 现 在 定义 更 一 般 形 式 的 
AB RZ ZK 

量词 (quantifier) Y (对 所 有 ) MAGE) 在 数学 命题 中 经 常 出 现 。 语 句 Vxzg 的 含义 
是 ， 对 于 变量 xz 的 每 个 值 ， 语 句 $ RER. XM, WA dare 的 含义 是 ， 对 于 变量 z 的 
某 个 值 ， 语 句 p 是 真 。 有时， 把 Y 称 为 全 称 量词 《universal quantifier)， 把 3 称 为 存在 量 
词 (existential quantifier)， 紧 跟 在 量词 后 面 的 变量 x 受到 该 量词 约束 (bound), 

例如 ， 对 于 自然 数 ， 语 句 Y xLz 十 1 二 zj 的 含义 是 : 每 一 个 自然 数 r 的 后 继 xz 十 1 都 
比 它 大 。 显 然 这 个 命题 为 真 。 然 而 ， 语句 yLy 十 y 二 3」 显然 是 假 的 。 当 解释 包含 量词 的 
语句 的 含义 时 ， 必 须 考虑 所 取 值 的 域 (universe)。 在 这 个 例子 中 ， 域 是 自然 数 ， 但 是 如 果 
改 用 实数 ， 则 带 存在 量词 的 语句 就 变 成 真 的 了 。 

语句 可 以 包含 多 个 量词 ， 如 Vz3 了 JyLy>zj。 对 于 目 然 数 域 ， 该 语句 的 语义 是 每 一 个 
ARSMAA-TARRILER. HANK REE., ARK, WA 了 3y VzLy> 
zj， 则 给 出 完全 不 同 的 含义 ， 即 存在 某 个 自然 数 比 所 有 其 他 数 都 大 。 显 然 ， 第 一 个 语句 为 
真 ， 第 二 个 语句 为 假 。 

量词 可 以 出 现在 数学 语句 中 的 任何 地 方 。 它 的 作用 范围 是 跟 在 量化 变量 后 的 一 对 匹配 
的 括 弧 内 出 现 的 语句 段 。 该 段 称 为 量词 的 辖 域 (scope) 。 通 常 ， 要 求 所 有 变量 都 出 现在 语 
句 的 开头 会 很 方便 ， 这 时 每 个 量词 的 辖 域 就 是 其 后 的 所 有 语句 成 分 。 这 种 语句 称 为 前 束 范 
式 (prenex normal form)。 很 容易 把 任何 语句 都 写成 前 束 范式 。 如 不 特别 指明 ， 只 考虑 这 
种 形式 的 语句 。 

种 量词 的 布尔 公式 称 为 量词 化 布尔 公式 (quantified Boolean formula) 。 对 于 这 种 公 
式 ， 域 是 {0,1}. Pa: 

和 
是 量词 化 布尔 公式 。 这 里 ，Yy 是 真 。 但 是 如 果 凑 倒 量词 Wz 和 3 了 Jy 的 次 序 ， 就 变 成 假 了 。 

如 果 公 式 的 每 个 变量 都 出 现在 某 一 量词 的 辖 域 内 ， 该 公式 就 称 为 全 量词 化 的 〈fully 
quantified) 。 全 量词 化 的 布尔 公式 有 时 称 为 句子 (sentence)， 它 要 么 是 真 ， 要 么 是 假 。 例 
如 ， 前 面 的 公式 $ 是 全 量词 化 的 。 但 是 ， 如 果 删 去 $ 的 开头 部 分 Vz， 该 公式 就 不 再 是 全 
量词 化 的 。 它 既 不 是 真 ， 也 不 是 假 。 

TQBF 问题 就 是 要 判定 一 个 全 量词 化 的 布尔 公式 是 真 还 是 假 。 定 义 语言 

TQBF = {(¢) | p 是 真 的 全 量词 化 的 布尔 公式 ) 

TQBF 是 PSPACE 完全 的 。 
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证 明 思 路 ”为 了 证 明 TQBF 属于 PSPACE， 给 出 一 个 简单 的 算法 。 该 算法 首先 给 变 
量 赋值 ， 然 后 递归 地 计算 公式 在 这 些 值 下 的 真 值 。 从 这 些 信 息 中 ， 算 法 就 能 确定 原 量 词 化 
公式 的 真 值 。 

为 了 证 明 PSPACE 中 的 每 个 语言 A 在 多 项 式 时 间 内 可 归 约 到 TQBF， 从 判定 A 的 多 
项 式 空间 界限 图 灵机 开始 ， 然 后 给 出 多 项 式 时 间 归 约 ， 它 把 一 个 字符 串 映射 为 一 个 量词 化 
的 布尔 公式 6, p 模拟 机 器 对 这 个 输入 的 计算 。 公 式 为 真 当 且 仅 当 机 吕 接受。 

作为 这 一 构造 的 首次 尝试 ， 模 仿 库 克 - 列 文 定理 的 证 明 思 路 ， 即 定理 7. 22。 可 以 构造 
公式 65， 通过 描绘 接受 画面 来 模拟 M 在 输入 w 上 的 计算 。M Ew 上 的 画面 宽度 是 O(n*)， 
即 M 消耗 的 空间 。 因 为 M 可 能 运行 指数 长 的 时 间 ， 所 以 它 的 高 度 是 n* 的 指数 。 因 此 ， 如 
果 直 接 用 公式 表示 画面 ， 就 可 能 导致 指数 长 的 公式 。 然 而 ， 多 项 式 归 约 不 能 产生 指数 长 的 
结果 ， 所 以 这 种 尝试 不 能 证 明 A<p TQBF., 

下 面 改 用 一 种 与 院 维 奇 定理 的 证 明 相关 的 技术 来 构造 公式 。 该 公式 把 画面 分 成 两 半 ， 
利用 全 称 量 词 的 功能 ， 用 公式 的 同一 部 分 来 代表 每 一 半 。 结 果 产 生 短 得 多 的 公式 。 

证 明 首先 ， 给 出 一 个 判定 TQBF 的 多 项 式 空间 算法 : 

T= 二 “对 输入 《8,5 是 一 个 全 量词 化 布尔 公式 : 

L 在 % 不 含量 词 ， 则 它 是 一 个 只 有 常数 的 表达 式 。 计 算 SW. GAR, WH 
sx; 否则 拒绝 。 

2. 右 y 等 于 zw， 在 少 上 递归 地 调用 工 ， 首 先 用 0 替换 zx， 然后 用 1 替换 zx。 只 
要 有 一 个 结果 是 接受 ， 则 接受 ; 否则 拒绝 。 

3. Ep STV ay Egy EIT. AGO 替换 zx， 然后 用 Re. GH 
个 结果 都 是 接受 ， 则 接受 ; 否则 拒绝 。” 

算法 本 显然 判定 TQBF。 为 了 分 析 它 的 空间 复杂 性 ， 我 们 发 现 它 递归 的 深度 最 多 等 于 
变量 的 个 数 。 在 每 一 层 只 需 存储 一 个 变量 的 值 ， 所 以 空间 总 消耗 是 Ol(m)， 其 中 是 8 中 
出 现 的 变量 的 个 数 。 因 此 械 在 线性 空间 内 运行 。 

接 下 来 ， 证 明 TQBF 是 PSPACE 难 的 。 设 A 是 一 个 由 图 灵机 M 在 n* 空间 内 判定 的 
语言 ，& 是 某 个 常数 。 下 面 给 出 一 个 从 A 到 TQBF 的 多 项 式 时 间 归 约 。 

该 归 约 把 字符 串 w 映射 为 一 个 量词 化 的 布尔 公式 $$。# 为 真 当 且 仅 当 M 接受 w。 为 了 
说 明 怎 样 构造 %， 需 解决 一 个 更 一 般 的 问题 。 利 用 两 个 代表 格局 的 变量 集合 c 和 cz 及 一 
个 数 :二 0， 构 造 一 个 公式 poso WRH cr 和 cz 赋 为 实际 的 格局 ， 则 该 公式 为 真 当 且 仅 
当 M 能 够 在 最 多 上 步 内 从 cl 到 达 cs 。 然 后 ， 可 以 令 p 是 公式 Pean coh? Hp h=”, 
d 是 一 个 选取 的 常数 ， 使 得 M 在 长 为 n 的 输入 上 可 能 的 格局 数 不 超过 2A KH, > 
f)=n*, ATH, ict 2 He. 

类 似 库 克 - 列 文 定 理 的 证 明 ， 该 公式 对 格局 单元 的 内 容 进 行 了 编码 。 对 应 于 单元 的 可 
能 设置 ， 每 个 单元 有 几 个 相关 的 变量 ， 每 个 带子 符号 和 状态 都 有 一 个 变量 对 应 。 每 个 格局 
A nt 个 单元 ， 所 以 用 Ont ) 个 变量 编码 。 

右 t 二 1， 则 容易 构造 8. ,。,,:。 设 计 公 式 ， 使 之 表达 要 人 么 cl 等 于 cs， 要 么 cl 能 在 M 的 
一 步 内 变 到 cs 。 为 了 表达 相等 性 ， 使 用 一 个 布尔 表达 式 来 表示 : 代表 cl 的 每 一 个 变量 与 
代表 co 的 相应 变量 包含 同样 的 布尔 值 。 为 表达 第 二 种 可 能 性 ， 利 用 库 克 - 列 文 定 理 的 证 
明 技 巧 ， 构 造 布尔 表达 式 表 示 ， 代 表 cl 的 每 个 三 元 组 的 值 能 正确 地 产生 相应 的 cz 的 三 元 
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组 的 值 ， 从 而 就 能 够 表达 cl 在 M 的 一 步 内 产生 co. 
A 上 >1， 递 归 地 构造 $. ,。,,:。 作 为 预演 ， 先 尝试 一 种 不 太 好 的 想法 ， 然 后 再 修正 
es = 
de, se = Amilge,sm,.¢ A om, se 1] 
符号 m 表示 M 的 一 个 格局 。3m1 是 3x1，… ,zi 的 缩写 ， 其 中 l=O'), 215°", E 
对 m1 编码 的 变量 。 所 以 ge ,。,: 的 这 个 构造 的 含义 是 : 如 果 存 在 某 个 中 间 格 局 za ， 使 得 M 


ELT EAM ci 变 到 m, HACE HAM m 变 到 cx ， 那 么 M 就 能 在 至 多 1 步 内 


从 ci 变 到 cs 。 然 后 再 递归 地 构造 $c ,m ,和 $m,c,, 这 两 个 公式 。 

公式 $c, ,cw 具有 正确 值 。 换 言 之 ， 只 要 M 能 在 上 步 内 从 ci 变 到 cs ， 它 就 是 TRUE. 
然而 ， 它 太 长 了 。 构 造 过 程 中 涉及 的 递归 的 每 一 层 都 把 i 的 值 减 小 一 半 ， 但 却 把 公式 的 长 
度 增 加 了 大 约 一 倍 ， 最 后 导致 公式 的 长 度 大 约 是 1:。 开 始 时 1 二 24#wW ， 所 以 这 种 方法 给 出 
的 公式 是 指数 长 的 。 

为 了 缩短 公式 的 长 度 ， 除 了 使 用 3 量词 以 外 ， 再 利用 VY 量词 。 令 

be se i = Ami Vegwey) E {Cer smy) 5 (m1 2) } [ bo ans 

新 引入 的 变量 代表 格局 cs 和 c4， 它 允许 把 两 个 递归 的 子 公 式 “ 折 又” 为 一 个 子 公 式 ， 而 
保持 原来 的 意思 。 通 过 写成 V (c3,c4)Ef{(lc,mi),《mi,cz)}， 就 指明 了 代表 格局 c 和 c4 
的 变量 可 以 分 别 取 cl 和 mi 的 变量 的 值 ， 或 者 m 和 co 的 变量 的 值 ， 结 果 公式 8 ,。 ,4 在 两 
种 情况 下 都 为 真 。 可 以 把 结构 VzE{ty',z)L…] 替换 为 等 价 的 结构 VxL(zx 二 yV x 二 x) 一 …j]， 
从 而 得 到 语法 正确 的 量词 化 布尔 公式 。 回 忆 第 0 章 的 内 容 ， 在 0.2 节 中 证 明了 布尔 蕴涵 
(>) 和 布尔 相等 (=) 可 以 用 AND 和 和 NOT 来 表达。 这 里 ， 为 了 表达 的 清晰 ， 使 用 符 
号 三 表示 布尔 相等 ， 而 没 使 用 等 价 符号 二 。 

为 了 计算 公式 $。,。,; 的 长 度 ， 其 中 二 240 ， 注 意 到 递归 每 一 层 增加 的 那 部 分 公式 
的 长 度 与 格局 的 长 度 呈 线性 关系 ， 所 以 长 度 是 O(CFGz))。 递 归 的 层 数 是 log(2% 22) w Oa). 
所 以 所 得 到 的 公式 的 长 度 是 OC f? (z) ) 。 = 


8.3.2 博弈 的 必 胜 策略 


本 书 中 ， 把 博弈 (game) 不 严格 地 定义 为 两 个 对 立方 的 竞赛 ， 每 一 方 都 按照 预先 确定 
的 规则 争取 达到 某 一 目标 。 博 弈 有 多 种 形式 ， 从 国际 象棋 这 一 类 棋盘 博弈 ， 到 作为 协作 或 
者 社会 冲突 模型 的 经 济 和 战争 博弈 等 。 

博弈 和 量词 紧密 相关 。 一 个 量化 的 语句 存在 一 个 之 对 应 的 博弈 ， 反之 ， 一 个 博弈 也 常 
存在 一 个 对 应 的 量化 语句 。 这 种 对 应 关系 在 以 下 几 个 方面 是 有 用 的 。 首 先 ， 把 一 个 包含 许 
多 量词 的 数学 语句 用 对 应 的 博弈 表达 出 来 ， 可 以 洞悉 该 语句 的 含义 。 其 次 ， 把 一 个 博弈 用 
量化 语句 表达 出 来 有 助 于 理解 该 博弈 的 复杂 性 。 为 了 阐明 博弈 与 量词 之 间 的 对 应 关系 ， 本 
节 描 述 了 一 种 称 为 公式 博弈 (formula game) 的 人 工 博弈 。 

设 % 王 3zl V zz 3z3…Q rely] 是 一 个 前 束 范式 的 量词 化 布尔 公式 ， 这 里 Q 代表 量词 
VRA. K $ 与 下 面 的 博弈 相关 联 。 两 名 选手 称 为 选手 A 和 选手 下 ， 轮 流 为 变量 zi,，…， 
ce 选 值 。 选 手 A 为 那些 VY 量词 约束 的 变量 选 值 ， 选 手 EE 为 那些 3 量词 约束 的 变量 选 值 。 进 
行 的 顺序 与 公式 开头 量词 出 现 的 顺序 相同 。 在 游戏 结束 时 ， 利 用 选手 给 变量 挑选 的 值 宣布 
结果 。 如 果 yy〔 即 删 去 量词 后 的 那 部 分 公式 ) 此 时 是 TRUE, WAFER; 如 果 y 此 时 是 
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FALSE， 则 选手 A M. 
WwW di 是 公式 
Jay Ya asl in V wed A Gre V wed A Ge V 2%) | 
在 $1 的 公式 博弈 中 ， 选 手 EE 挑选 zi 的 值 ， 选 手 A 挑选 zz 的 值 ， 最 后 选手 下 挑选 zs 
的 值 。 

举 一 个 该 博弈 游戏 过 程 的 例子 。 照 例 ， 用 1 表示 布尔 值 TRUE， 用 0 表示 FALSE. 
HAF E 挑选 x1 二 1， 然后 选手 A 挑选 xz 一 0， 最 后 选手 玉 挑 选 x3 二 1。 当 zi，zx2 和 zs 
取 这 些 值 时 ， 子 公式 (21 V 22) Alr: V 23) A Cz V3) 是 1， 所 以 选手 EE 说。 实际 上 ， 选 
手下 总 可 以 赢得 这 场 博弈 ， 只 要 它 挑选 zi: 二 1， 然 后 不 论 选 手 A 给 zs 选 什 么 值 ，E 都 给 
x3 选 与 zz 相反 的 值 。 我 们 称 选 手下 有 这 场 博弈 的 必 胜 策 略 (winning strategy), MRM 
方 都 下 出 最 佳 步骤 时 ， 某 个 选手 能 赢 ， 则 该 选手 有 该 博弈 的 必 胜 策 略 。 

现在 稍微 修改 一 下 公式 ， 得 到 一 个 博弈 ， 使 得 选手 A 有 必 胜 策略 。 设 % 是 公式 

dai Vz: Jaxl íz V x2) A (zo V x3) A Cæ: V 23) J 
现在 选手 A 有 必 胜 策略 ， 因 为 不 论 选 手 玉 为 zı HAA, HFA 可 以 选 zz 二 0， 从 而 使 
量词 后 面 出 现 的 那 部 分 公式 为 假 ， 而 不 论 选 手 卫 在 最 后 一 步 选 什么 值 。 m 
下 面 考 虑 判定 在 与 某 个 具体 的 公式 相关 联 的 公式 博弈 中 哪 一 方 有 必 胜 策略 的 问题 。 令 
FORMULA-GAME = {(¢) | 在 与 风 相 关联 的 公式 博弈 中 选手 正 有 必 胜 策略 } 

FORMULA-GAME 是 PSPACE 完全 的 。 

证 明 思 路 ” FORMULA-GAME 是 PSPACE 完全 的 ， 理 由 很 简单 ， 即 它 和 TQBF 是 
一 样 的 。 为 了 看 出 FORMULA GAME 二 TQBF， 注 意 到 一 个 公式 恰好 当选 手 E 在 相关 联 
的 公式 博弈 中 有 必 胜 策略 时 为 TRUE， 因 为 两 种 情况 有 同样 的 含义 。 

证 明 公式 $= 二 3zxi V zz 3zx3…[Lyj]」 是 TRUEM ARE: 存在 zi 的 某 种 赋值 ， 使 得 
对 于 zz 的 任意 赋值 ， 存 在 zs 的 某 种 赋值 ， 使 得 …… ， 等 等 ， 其 中 y 在 这 些 变量 的 赋值 下 
为 TRUE。 类 似 地 ， 选 手下 在 与 上 关联 的 博弈 中 有 必 胜 策略 的 条 件 是 : 选手 下 可 以 给 zl 
赋 某 个 值 ， 使 得 对 于 zs 的 任意 赋值 ， 选 手下 可 以 给 zs 赋 一 个 值 ， 使 得 ……… ， 等 等 ， 其 中 
在 变量 的 这 些 赋值 下 为 TRUE, 

当 公 式 不 存在 量词 与 全 称 量词 之 间 交 蔡 时 ， 同 样 的 推理 也 能 成 立 。 如 果 A 的 形式 为 
V Ti ,XT2 ,TX3 了 XT4,X5 Y xeLy]， 选 手 A 在 公式 博弈 中 走 头 三 步 ， 给 zl ,x 和 zs 赋值 ; 然后 
选手 玉 走 两 次 ， 给 ze 和 zs 赋值 ;最 后 选手 A 给 ze 赋 一 个 值 。 

因此 ，yETQBF 恰好 当 pE FORMULA-GAME 时 成 立 ， 由 定理 8.8, REMMI. m 


8.3.3 广义 地 理学 


既然 知道 公式 博弈 是 PSPACE 完全 的 ， 就 能 更 容易 地 证 明 某 些 其 他 博弈 的 PSPACE 
完全 性 或 PSPACE 难 解 性 。 本 小 节 从 地 理学 游戏 的 推广 开始 ， 然 后 讨论 如 国际 象棋 、 跳 
棋 和 GO 这 样 的 博弈 。 

地 理学 是 一 种 儿童 游戏 ， 选 手 们 轮流 给 世界 各 地 的 城市 命名 。 每 一 座 选 中 的 城市 的 首 
字母 必须 与 前 一 座 城市 的 尾 字母 相同 ， 不 允许 重复 。 游 戏 从 某 个 指定 的 城市 开始 ， 以 茶 一 
方 因 无 法 延续 而 认输 为 止 。 例 如 ， 如 果 游 戏 从 Peoria 开始 ， 那 么 下 面 可 以 跟 Amherst (A 
为 Peoria BH a, mM Amherst 的 首 字 母 也 是 a)， 然 后 可 以 是 Tucson, RA 





Nashua， 等 等 ， 直 到 一 方 被 难 倒 并 输 掉 比赛 为 止 。 

可 以 用 有 回 图 作为 该 游戏 的 模型 ， 图 中 的 结 点 是 世界 各 地 的 城市 。 根 据 游 戏 规则 ， 如 
采 一 座 城市 可 以 导 回 另 一 座 城市 ， 则 从 前 一 座 城市 到 后 一 座 城市 画 一 个 箭头 。 换 言 之 ， 如 
采 城 市 X 的 尾 字母 与 城市 Y 的 首 字 母 相 同 ， 则 图 中 就 包含 一 条 从 城市 X 到 城市 Y 的 边 。 
图 8- 2 中 展示 了 一 部 分 地 理学 图 。 





图 8-2 代表 地 理学 游戏 的 部 分 图 


当地 理学 规则 翻译 为 这 种 图 表示 法 时 ， 一 名 选手 从 指定 的 起 始 结 点 开始 ， 然 后 选手 们 
交 蔡 地 挑选 结 点 ， 形 成 图 中 的 一 条 简单 路 径 〈 即 每 个 结 点 只 能 用 一 次 ， 对 应 于 要 求 城市 不 
能 重复 ) 。 第 一 个 不 能 扩展 路 径 的 选手 输 掉 比赛 。 

在 广义 地 理学 (generalized geography) 中 ， 用 任意 的 
带 有 指定 起 始 结 点 的 有 向 图 代替 了 与 实际 城市 相关 联 的 
图 。 例 如， 图 8- 3 是 一 个 广义 地 理学 游戏 的 例子 。 

We ICE, CEI MBE. CARH, FIE 
如 下 的 必 胜 策略 。 选 手工 从 结 点 1， 即 指定 的 起 始 结 点 开 
始 。 结 点 1 只 能 指 问 结 点 2 和 3， 所 以 选手 工 的 第 一 步 必 
须 是 这 两 种 选择 之 一 。 他 选 3。 现 在 轮 到 选手 了 [[ 走 了 ,但 
结 点 3 仅 指 向 结 点 5， 所 以 她 被 迫 选择 结 点 5。 然 后 选手 从 6、7、8 中 选择 6。 现 在 选手 
[必须 从 结 点 6 出 发 ， 但 是 它 仅 指向 结 点 3， 而 3 在 前 面 已 经 走 过 了 。 选 手 卫 被 困 住 了 ， 
FHF IM. 

MARES, MBI 36 SWAT, MEF ARE. BEA H 
KWE? WRF RUA RH RE 3, MAF UR 6 为 应 手 ， 立 即 赢得 比赛 ， 
所 以 选手 工 唯一 的 希望 是 到 绪 点 2。 但 在 这 种 情况 下 ， 选 手 卫 以 4 为 应 手 。 如 果 选 手 I 现 
在 取 5， 则 选手 卫 取 6 Rt. MRF LR 7, MEF IR ORM. KKM EAE, 
w+ I Bam, MUF I AYER. 

判定 在 广义 地 理学 游戏 中 哪 一 方 有 必 胜 策略 的 问题 是 PSPACE 完全 的 。 令 

GG = (G,b>| 在 图 CG 上 以 结 点 六 起 始 的 广义 地 理学 游戏 中 ,选手 有 必 胜 策略 ) 

GG 是 PSPACE 完全 的 。 

证 明 思 路 用 与 定理 8. 8 中 判定 TQBF 时 所 用 的 算法 相似 的 一 个 递归 算法 ， 就 能 判定 
哪 方 有 必 胜 策略 。 该 算法 在 多 项 式 空间 内 运行 ， 所 以 GCCE PSPACE, 

为 了 证 明 GG 是 PSPACE 难 的 ， 给 出 一 个 从 FORMULA-GAME 到 GG 的 多 项 式 时 间 





图 8-3 广义 地 理学 游戏 样 例 
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归 约 。 该 归 约 把 一 个 公式 博弈 转化 为 一 个 广义 地 理学 图 ， 使 得 图 上 的 游戏 过 程 模拟 公式 博 
弈 的 游戏 过 程 。 实 际 上 ， 广 义 地 理学 游戏 的 选手 就 是 在 玩 一 种 编码 形式 的 公式 博弈 。 
证 明 下 面 的 算法 判定 在 广义 地 理学 实例 中 ， 选 手 1 是 否 有 必 胜 策略 。 换 句 话 说 ， 它 
判定 GG。 现 证 明 它 在 多 项 式 空间 内 运行 。 
M 二 “对 输入 〈G,6;，G 是 有 问 图 ,6b 是 G 的 结 点 : 
L. b 出 度 为 0， 则 拒绝 ， 因 为 选手 I 立即 输 。 
2. 删 去 结 点 5 以 及 与 它 关 联 的 所 有 箭头 . 得 到 一 个 新 图 G 。 
3. 对 于 5 原先 指向 的 每 个 结 点 51,62,…,b:， 在 《G' ,b;〉 上 递归 地 调用 M. 
4. 硅 所 有 调用 都 接受 ， 则 选手 [在 原先 博弈 中 有 必 胜 策 略 ， 所 以 拒绝 。 否 则 ， 选 
手 卫 没有 必 胜 策 略 ， 而 选手 I 有 必 胜 策略 ， 因 此 接受 。” 
本 算法 仅 需要 用 来 存储 递归 栈 的 空间 。 递 归 的 每 一 层 给 栈 中 添加 一 个 结 点 ， 最 多 可 能 
Am], m 是 G 的 结 点 数 。 因 此 算法 在 线性 空间 内 运行 。 
为 了 证 明 GG 的 PSPACE 难 解 性 ， 证 明 FORMULA-GAME 多 项 式 时 间 可 归 约 到 GG。 
归 约 把 公式 
$ = Ixi V z2 Irz Q rely] 和 
映射 为 广义 地 理学 的 一 个 实例 〈“G,6b5;。 为 了 简单 ， 这 里 假定 $ 的 量词 以 3 开头 ， 以 3 结尾 ， 
并 且 3 和 VY 严格 地 交替 出 现 ， 不 符合 这 个 假定 的 公式 可 以 转化 为 稍 长 一 些 的 符合 假定 的 公 
式 ， 这 只 需 添 加 一 些 额 外 的 量词 ， 约 束 一 些 在 别处 不 使 用 的 变量 〈 或 称 “ 旺 ”变量 )。 还 
假定 y 是 合 取 范式 的 (参见 问题 8. 28). 
对 于 归 约 构造 图 G 上 的 地 理学 游戏 ， 其 中 最 优 走 步 模拟 
$ 上 的 公式 博弈 的 最 优 走 步 。 地 理学 游戏 中 的 选手 I 扮演 公 
式 博 弈 中 的 选手 下 的 角色 ， 选 手 开 扮演 选手 AWA. 
AG 的 结构 部 分 地 示 于 图 8- 4 中 。 游 戏 从 结 点 5 开始 ， 
它 出 现在 G 的 顶层 左边 。 在 2 下 面 是 一 列 钻石 结构 ，y 的 每 
一 个 变量 对 应 一 个 。 在 描述 G 的 右边 之 前 ， 先 看 游戏 在 左边 
如 何 进行 。 
游戏 从 2 开始 。 选 手工 必须 选择 从 2 出 发 的 两 条 边 之 一 ， 
这 两 条 边 对 应 于 选手 正在 公式 博弈 开始 时 的 可 能 选择 。 选 手 
I 选择 左边 ， 对 应 于 公式 博弈 中 选手 E 选择 TRUE， 选 择 右 
边 对 应 于 FALSE。 在 选手 I 已 经 选择 了 一 条 边 之 后 ,假设 
是 左边 那 条 ， 该 选手 [[ 走 步 了 。 因 为 只 有 一 条 出 边 ， 所 以 这 
一 步 没 有 选择 。 类 似 地 ， 选 手工 的 下 一 步 也 没有 选择 ， 游 戏 图 8-4 模拟 公式 博弈 的 地 理学 
从 第 二 个 钻石 的 顶部 继续 进行 。 现 在 再 次 有 两 条 边 ， 但 是 轮 游戏 的 部 分 结构 
到 选手 [选择 了 。 这 次 选择 对 应 于 在 公式 博弈 中 选手 A 的 第 
一 步 。 随 着 游戏 以 这 种 方式 继续 进行 ， 选 手 [ 和 了 选择 向 右 或 向 左 的 路 人 径 通过 每 个 钻石 
结构 。 
在 游戏 经 过 所 有 钻石 结构 以 后 ， 路 径 的 末端 在 最 后 一 个 钻石 的 底部 结 点 ， 而 且 轮 到 选手 
[ 走 步 了 ， 因 为 假定 最 后 一 个 量词 是 3 。 选 手 I[ 的 下 一 步 没 有 选择 。 然 后 他 们 到 达 图 8- 4 的 结 
Ac HAAF IEF}. 
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地 理学 游戏 走 到 这 一 步 对 应 于 公式 博弈 过 程 的 结束 。 所 选择 的 通过 钻石 结构 的 路 径 对 
应 于 给 y 的 变量 的 赋值 。 在 该 赋值 下 ， 如 果 % 是 TRUE， 则 选手 下 赢得 公式 博弈 WR yg 
是 FALSE， 则 选手 A 赢 。 图 8-5 所 示 的 右边 结构 保证 当选 手下 赢 时 选手 工 能 赢 ， 而 且 当 
选手 A 赢 时 选手 开 能 赢 ， 说 明 如 下 。 


TRUE (b) FALSE 


SS 


X 





图 8-5 模拟 公式 博弈 的 地 理学 游戏 的 全 部 结构 ， 其 中 4 二 Jar Vae Jarl l V ZV x3) A 
(VR Aw ) 


在 结 点 <， 选手 卫 可 以 选择 一 个 对 应 y 的 某 个 子 句 的 结 点 ， 然 后 选手 上 可 以 选择 一 个 
对 应 该 子 句 中 的 一 个 文字 的 结 点 。 对 应 不 带 非 的 文字 的 结 点 连接 到 对 应 有 关 变 量 的 钻石 的 
左边 (TRUE) ， 对 于 带 非 的 文字 和 右边 (FALSE) 情况 类 似 ， 如 图 8- 5 所 示 。 

如 果 y% 是 FALSE， 则 选手 开 可 以 选择 不 满足 的 子 句 而 取胜 。 选 手工 此 时 可 以 选择 的 
文字 都 是 FALSE， 并 被 连 到 钻石 中 还 未 走 过 的 那 一 边 。 于 是 选手 下 可 以 选择 钻石 中 的 那 
个 结 点 ， 而 选手 工 无 法 走 步 了 ， 从 而 输 掉 。 如 果 4 是 TRUE， 则 选手 开 挑 选 的 所 有 子 句 都 
包含 TRUE 文字 。 选 手工 在 选手 开 走 步 后 选择 那个 文字 。 因 为 该 文字 是 TRUE, MUIE 
被 连 到 钻石 中 已 经 走 过 的 那 一 边 ， 因 此 选手 开 无 法 走 步 ， 输 掉 。 s 

定理 8. 11 说 明 在 广义 地 理学 中 ， 不 存在 计算 最 佳 走 步 的 多 项 式 时 间 算 法 ， 除 非 P= 
PSPACE。 我 们 希望 在 计算 如 国际 象棋 这 一 类 棋盘 博弈 的 最 佳 走 步 方 面 能 够 证 明 类 似 的 难 
解 性 定理 ， 但 是 存在 一 个 障碍 。 采 用 标准 的 8X8 国际 象棋 棋盘 只 能 出 现 有 穷 个 不 同 的 棋 
局 。 理 论 上 ， 所 有 这 些 棋 局 以 及 它们 的 最 佳 走 步 可 以 放 在 一 张 表 里 。 这 张 表 会 大 到 整个 星 
系 都 放 不 下 ， 但 它 却 是 有 穷 的 ， 可 以 存放 在 图 灵机 的 控制 单元 中 (甚至 有 穷 自动 机 的 控制 
单元 中 !)。 于 是 机 器 就 可 以 通过 查 表 在 线性 时 间 内 走出 最 佳 步 。 也 许 在 将 来 会 有 办 法 度量 
有 穷 问题 的 复杂 性 ,但 是 目前 的 办 法 是 渐 近 的 ， 因 此 只 能 用 来 度量 复杂 性 随 着 问题 规模 的 
增加 而 变化 的 增长 率 一 一 而 不 能 用 于 任何 固定 规模 。 不 过 ， 通 过 把 许多 棋盘 博弈 推广 到 
nXn 棋 盘 上 ， 可 以 就 计算 它们 的 最 佳 走 步 的 难 解 性 给 出 某 些 证 据 。 这 种 推广 的 国际 象棋 、 
跳棋 和 GO 已 被 证 明 是 PSPACE 难 的， 甚至 对 于 更 大 的 复杂 性 类 是 难 的 ， 这 有 赖 于 推广 的 
细节 。 
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8.4 LF NL 类 


到 目前 为 止 ， 我们 只 考虑 了 时 间 和 空间 复杂 性 界限 至 少 是 线性 的 情况 ， 即 界限 f) 
至 少 是 n。 现 在 考察 更 小 的 亚 线 性 (sublinear) 空间 界限 。 在 时 间 复 杂 性 中 ， 亚 线性 界限 

还 不 够 读 完 输入 ， 所 以 这 里 不 考虑 它们 。 在 亚 线性 空间 复杂 性 中 机 器 可 以 读 完 整个 输入 ， 
但 是 它 没有 足够 的 空间 存储 输入 。 为 了 使 对 这 种 情况 的 考虑 有 意义 ， 必 须 修 改 计 算 模 型 。 

下 面 引 入 一 种 有 两 条 带子 的 图 灵机 : 一 条 只 读 输 入 带 和 一 条 读 写 工作 带 。 在 只 读 带 上 
输入 头 能 读 取 符号 ， 但 不 能 改变 它们 。 这 个 头 必 须 停留 在 包含 输入 的 那 部 分 带子 上 。 可 以 
给 机 需 提 供 一 个 方法 ， 使 它 能 够 检测 读 写 头 处 于 输入 的 左 关 和 右 问 的 时 刻 。 工 作 珊 可 以 用 
通常 的 方式 读 写 。 只 有 工作 带 上 被 扫描 的 单元 才 构 成 这 种 形式 的 图 灵机 的 空间 复杂 性 。 

可 以 把 只 读 输 入 带 想 象 成 CD-ROM， 即 一 种 在 许多 个 人 计算 机 上 用 于 输入 的 设备 。 
通常 ，CD- ROM 包含 的 数据 比 计 算 机 能 存放 在 主 存 中 的 数据 更 多 。 亚 线性 空间 算法 允许 
计算 机 处 理 没有 全 部 存放 在 主 存 中 的 数据 。 

对 于 至 少 是 线性 的 空间 界限 ， 双 带 图 灵机 模型 等 价 于 标准 的 单 带 模型 (参见 练 
习 8. 1) 。 对 于 亚 线性 空间 界限 ， 只 采用 双 带 模型 。 

CPEB 工 是 确定 型 图 灵机 在 对 数 空 间 内 可 判定 的 语言 类 。 换 言 之 ， 

L = SPACE(Clog n) 
NL 是 非 确 定型 图 灵机 在 对 数 空间 内 可 判定 的 语言 类 。 换 言 之 ， 
NL = NSPACE(log n) 

我 们 关注 log n 空间 ， 而 不 关注 如 Vn 或 log?n 空间 的 理由 与 选择 多 项 式 时 空 界限 的 理 
由 相似 。 对 数 空间 足以 求解 许多 有 趣 的 计算 问题 ， 而 且 其 数学 性 质 也 富有 了 吸引 力 ， 比 如 当 
机 器 模型 和 输入 的 编码 方法 改变 时 仍 保 持 稳健 性 。 指 向 输入 的 指针 可 以 在 对 数 空间 内 表 
示 ， 所 以 考虑 对 数 空间 算法 的 计算 能 力 的 一 种 方式 是 考虑 固定 数目 的 输入 指针 的 计算 
能 力 。 

(二 四 iS A=(0'l|2>0} 是 工 的 成 员 。 在 7.1 节 中 描述 了 一 个 判定 A 的 图 灵 
机 ， 它 左右 来 回 扫描 输入 ， 删 掉 匹 配 的 0 和 1。 该 算法 用 线性 空间 记录 哪些 位 置 已 经 被 删 
掉 了 ， 但 可 以 修改 为 只 使 用 对 数 空间 。 

判定 A 的 对 数 空间 图 灵机 不 能 删除 输入 带 上 已 经 匹配 的 0 和 1， 因为 该 带 是 只 读 的 。 
机 器 在 工作 带 上 用 二 进 制 分 别 数 0 和 1 的 数目 ， 唯 一 in oping 
的 。 在 二 进 制 形式 下 ， 每 个 计数 器 只 消耗 对 数 空间 ， 因 此 算法 在 O(log n) 空间 内 运 
FFU AEL, E 
回忆 7.2 节 中 定义 的 语言 PATH=={(G,s,t) 1G 是 包含 从 s 到 上 的 有 向 路 径 
的 有 向 图 } 。 定 理 7.12 证 明 PATH AFP, 但 是 给 出 的 算法 消耗 线性 空间 。 还 不 清楚 
PATH 是 否 能 确定 性 地 在 对 数 空间 内 解决 ， 但 是 的 确 知 道 一 个 判定 PATH 的 非 确 定性 的 
对 数 空间 算法 。 

判定 PATH 的 非 确 定型 对 数 空间 图 灵机 从 结 点 s 开始 运算 ， 非 确定 地 猜测 从 到 + 的 
路 径 的 每 一 步 。 机 器 在 工作 带 上 只 记录 每 一 步 当 前 结 点 的 位 置 ， 而 不 是 整 条 路 径 (否则 将 
超出 对 数 空 间 的 要 求 ) 。 机 器 从 当前 结 点 所 指 回 的 结 点 中 非 确 定 地 选择 下 一 个 结 点 。 它 反 
复 执行 这 一 操作 ， 直 至 到 达 结 点 t 而 接受 ， 或 者 执行 m 步 以 后 拒绝 ， 其 中 mm 是 图 中 的 结 点 





数 。 因 此 PATH 属于 NL. mi 

以 前 所 得 出 的 关于 f(n) 空间 界限 的 图 灵机 也 在 2%/"*”” 时 间 内 运行 的 断言 对 于 非常 小 
的 空间 界限 就 不 再 成 立 。 例 如 ， 消 耗 O(1) ( 即 常数 ) 空间 的 图 灵机 就 可 能 运行 n 步 。 为 
了 获得 适用 于 所 有 空间 界限 a) 的 运行 时 间 界 限 ， 给 出 下 面 的 定义 。 

若 M 是 一 个 有 单独 的 只 读 输 入 带 的 图 灵机 ， 了 刀 是 输入 ， 则 M Ew 上 的 
格局 包含 状态 、 工 作 带 和 两 个 读 写 头 位 置 。 输 入 w PERM Ew 上 的 格局 的 一 部 分 。 

如 果 M 在 f(n) 空间 内 运行 ，w 是 长 为 n WWA, W M Aw 上 的 格局 数 是 n20%"/"*””， 
为 了 解释 这 一 结果 ,， MAc 个 状态 和 8& 个 带子 符号 。 能 够 出 现在 工作 带 上 的 字符 串 的 
数目 是 gf 。 输 入 头 可 以 处 在 nn 个 位 置 之 一 ， 工 作 带 头 可 以 处 在 f(n) 个 位 置 之 一 。 因 此 
ME w 上 的 格局 总 数 (也 就 是 M Ew 上 的 运行 时 间 的 上 界 ) 等 于 cnf (n) gl” 
或 n2 (OC (nm)) . 

我 们 几乎 只 关注 不 小 于 log n 的 空间 界限 f(n)。 对 于 这 样 的 界限 ， 前 面 关 于 机 器 的 时 
间 复 杂 性 最 多 不 超过 它 的 空间 复杂 性 的 指数 倍 的 断言 依然 成 立 ， 因 为 当 (mn) Slog n 时 ， 
n20 Sm) 等 于 DOF) | 

EIL FP, pea AT ee PRAHA, SPE HA RHL A Ae MARL. ME fnn 
时 ， 空 间 复 杂 性 fn) 只 增加 平方 。 可 以 推广 萨 维 奇 定 理 ， 使 它 对 于 亚 线性 空间 界限 n> 
log n 也 能 成 立 。 证 明 与 7.1 节 给 出 的 原始 证 明基 本 相同 ， 只 是 采用 有 只 读 输入 带 的 图 灵 
机 ， 在 涉及 N 的 格局 的 地 方 改 用 NN 在 w 上 的 格局 。 FAEN Ew 上 的 格局 需要 
log(2257 2 ) 一 log n 十 O(f(n)) 空间 。 如 果 f(n) 宇 log n， 则 存储 消耗 是 O(f(n))， 证 明 
的 其 余部 分 都 相同 。 


8.5 NL 完全 性 


正如 在 例 8. 14 中 提 到 的 , GA PATH 问题 属于 NL, 但 不 知道 它 是 否 在 LL 中。 人 们 相 
fā PATH 不 属于 L, 但 是 不 知道 怎样 证 明 这 一 猜想 。 实 际 上 ， 还 不 知道 NL 中 有 哪 一 个 问题 
可 以 被 证 明 不 属于 L。 类 似 于 P 二 NP 是 否 成 立 的 问题 ， 也 有 LNL 是 否 成 立 的 问题 。 

作为 解决 LANL 问题 的 一 个 步 又， 需要 先 证 明 某 些 语言 是 NL 完全 的 。 正 如 其 他 复 
杂 性 类 的 完全 语言 一 样 ，NL 完全 语言 在 一 定 意义 上 是 NL 中 最 困难 的 语言 的 样 例 。 如 果 
L 与 NL 不 相等 ， 那 么 所 有 NL 完全 语言 就 不 属于 L. 

如 前 面 完全 性 的 定义 一 样 ，NL 完全 语言 定义 为 属于 NL， 并 且 NL 中 的 所 有 其 他 语言 
都 可 归 约 到 它 。 但 是 这 里 不 用 多 项 式 时 间 可 归 约 性 ， 这 是 因为 所 有 NL 中 的 问题 都 在 多 项 
式 时 间 内 可 解 。 除 了 CO 和 3 以 外 ，NL 中 的 任何 两 个 问题 都 是 互相 多 项 式 时 间 可 归 约 的 
(参见 8. 3 节 PSPACE 完全 性 的 定义 中 关于 多 项 式 时 间 可 归 约 性 的 讨论 )， 所 以 多 项 式 时 
间 可 归 约 性 太 强 ， 不 能 把 NL 中 的 问题 彼此 区 分 开 。 可 以 改 用 一 种 新 型 可 归 约 性 ， 称 为 对 
数 空间 可 归 约 性 。 

对 数 空间 转换 器 (log space transducer) 是 有 一 条 只 读 输 入 带 、 一 条 只 
写 输出 带 和 一 条 读 / 写 工作 带 的 图 灵机 。 输 出 带 的 头 部 不 能 向 左 移动 ， 因 此 它 不 能 读 已 写 
内 容 。 工 作 带 可 以 包含 O(log(n)) 个 符号 。 对 数 空间 转换 器 M 计算 一 个 函数 了 :3* 一 35*， 
其 中 f(w) 是 把 w 放 在 M 的 输入 带 上 启动 M 运行 到 M 停机 时 输出 带 上 存放 的 字符 串 。 
RK 三 为 对 数 空 间 可 计算 函数 (log space computable function)。 如 果 语 言 A 通过 对 数 空 间 
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可 计算 函数 f 映射 可 归 约 到 语言 B， 则 称 A 对 数 空间 可 归 约 (log space reducible) 到 B, 
记 为 ASB. 

现在 已 经 做 好 定义 NL 完全 性 的 准备 。 

语言 B 是 NL 完全 的 ， 如 果 

le BENLs FA 

2. NL 中 的 每 个 A 对 数 空间 可 归 约 到 B。 

如 果 一 个 语言 对 数 空间 可 归 约 到 男 一 个 已 知 属 于 LL 的 语言 ， 则 这 个 语言 也 属于 L， 如 
下 述 定理 所 阐明 的 。 

A<LB 且 BEL， 则 AEL。 

证 明 本 定理 的 一 个 诱 人 的 证 明 思 路 是 仿照 定理 7.25 的 模式 ， 那 里 证 明了 多 项 式 时 
间 可 归 约 性 的 类 似 结 果 。 按 照 这 种 思路 ，A 的 对 数 空间 算法 首先 用 对 数 空间 归 约 f 把 输入 
w 映射 为 1(w)， 然 后 应 用 B 的 对 数 空间 算法 。 但 是 存储 f(w) 的 空间 需求 量 可 能 太 大 ， 
不 能 放 进 对 数 空间 界限 内 ， 所 以 需要 修改 这 种 方法 。 

A 的 机 器 Ma 不 再 算出 整个 f(w)， 而 是 当 B 的 机 器 Ms 需要 的 时 候 计 算 fw) 的 个 别 
符号 。 在 模拟 过 程 中 ，MA 记 录 Ms 的 输入 头 在 f(w) 上 的 位 置 。 每 一 次 Ms 移动 时 。Ma 
重新 开始 在 w Lith ff, ROE fw) 上 的 位 置 以 外 ， 其 余 输 出 全 部 忽略 。 这 么 做 
可 能 不 时 地 要 求 重新 计算 f(w) 的 某 些 部 分 ， 因 而 在 时 间 复 杂 性 方面 是 低 效 的 。 这 种 方法 


的 好 处 是 在 任何 时 刻 只 需 存储 f(w) 的 一 个 符号 ， 其 结果 是 用 时 间 来 换取 空间 。 a 
车 有 一 个 NL 完全 语言 属于 工 ， 则 L=NL, 
图 中 的 搜索 


PATH 是 NL 完全 的 。 

证 明 思 路 ” 例 8.14 证 明了 PATH 属于 NL， 所 以 只 需 证 明 PATH 是 NL 难 的 。 换 言 
之 ， 必 须 证 明 NL 中 的 每 个 语言 A 对 数 空间 可 归 约 到 PATH ， 

从 A 到 PATH 的 对 数 空间 归 约 背后 的 思想 是 构造 一 个 图 ， 用 来 表示 判定 A 的 非 确定 
型 对 数 空间 图 灵机 的 计算 过 程 。 归 约 把 字符 串 w 映射 为 一 个 图 ， 图 中 结 点 对 应 于 非 确定 型 
图 灵机 在 输入 双 上 的 格局 。 一 个 结 点 能 指向 另 一 个 结 点 的 条 件 是 第 一 个 结 点 对 应 的 格局 能 
在 非 确 定型 图 灵机 的 一 步 内 产生 第 二 个 结 点 对 应 的 格局 。 因 此 ， 只 要 从 对 应 初始 格局 的 结 
点 到 对 应 接受 格局 的 结 点 之 间 存 在 一 条 路 径 ， 则 机 上 需 接 受 w 

WEAR 这 里 说 明了 怎样 给 出 一 个 从 NL 中 的 任意 语言 A 到 PATH 的 对 数 空间 归 约 。 
设 非 确 定型 图 灵机 M 在 O(logn) 空间 内 判定 A。 给 定 输入 w， 在 对 数 空间 内 构造 《G,s,?)， 
其 中 G 为 有 向 图 ，G 包含 从 s 到 t 的 路 径 当 上 且 仅 当 M 接受 w., 

G 的 结 点 是 M Ew 上 的 格局 。 对 于 M 在 w 上 的 格局 c1 和 cb， 如 果 cs 是 M 从 ci 出 发 
的 下 一 个 可 能 的 格局 ， 则 (ci ,ce〉 是 G 的 一 条 边 。 更 精确 地 说 ， 如 果 M ORS wes. 
cl 的 状态 和 它 的 输入 带头 和 工作 带头 下 的 符号 一 起 能 产生 下 一 个 状态 和 带头 动作 ， 使 c 
成 cz， 那么 (cl ,cz) 是 G 的 一 条 边 。 结 点 s 是 M 在 w 上 的 初始 格局 。 机 器 M 被 修改 为 只 
有 唯一 的 接受 格局 ， 把 该 格局 指定 为 结 点 t 

该 映射 把 A 归 约 到 PATH ， 原 因 是 只 要 M 接受 输入 ， 它 就 有 一 个 计算 分 支 接 受 ， 这 
对 应 于 G 中 一 条 从 起 始 格 局 s 到 接受 格局 t 的 路 径 。 反 之 ， 如 果 G 中 存在 从 s Bt MRE. 
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则 M 在 输入 w 上 运行 时 ， 某 个 计算 分 支 必 定 接 受 ， 从 而 M 接受 w 

为 了 证 明 该 归 约 在 对 数 空间 内 运算 ,给 出 一 个 对 数 空间 转换 器 ， 它 在 输入 w 上 输出 
《G,s,t)。 通 过 列 出 G 的 结 点 和 边 来 描述 G。 列 出 结 点 很 容易 ， 因 为 每 个 结 点 是 M 在 w 上 
的 一 个 格局 ， 可 以 在 空间 clog n 内 表示 出 来 ,，c 是 某 个 常数 。 转 换 器 顺序 地 走 遍 所 有 可 能 
的 长 为 clog n 的 字符 串 ， 检查 每 一 个 是 否 为 M 在 w 上 的 合法 格局 ， 输 出 那些 通过 检查 的 
字符 串 。 类 似 地 ， 转 换 器 也 列 出 边 。 对 数 空间 足以 验证 M Ew 上 的 一 个 格局 cil 能 否 产 生 
格局 cx ， 因 为 转换 器 只 需 通过 考察 cl 中 读 写 头 位 置 下 的 带子 内 容 ， 以 此 来 决定 M 的 转移 
图 数 是 否 会 产生 格局 co 作为 结果 。 转 换 器 依次 检查 所 有 的 Cic), RARE E G 的 合格 
的 边 。 那 些 合格 的 边 被 添加 到 输出 市 上 。 = 

定理 8.20 的 一 个 直接 的 副产品 是 下 面 的 推论 ， 它 称 NL 是 了 的 子 集 。 

NLCP, 

证 明 定理 8. 20 说 明 ，NL 中 的 任何 语言 对 数 空 间 可 归 约 到 PATH, WW. HF 
耗 空间 f(r) 的 图 灵机 在 时 间 2z22 关 六 内 运行 ， 所 以 在 对 数 空间 内 运行 的 归 约 器 也 在 多 项 
式 时 间 内 运行 。 因 此 ，NL 中 的 任何 语言 多 项 式 时 间 可 归 约 到 PATH, eH 7.12 知 后 
者 属于 了 P。 又 知 每 一 个 多 项 式 时 间 可 归 约 到 了 中 的 语言 的 语言 也 在 PP 中， 所 以 证 毕 。 a 

虽然 对 数 空间 可 归 约 性 限制 更 加 严格 ,但 是 由 于 计算 问题 通常 是 简单 的 ， 故 对 于 复杂 
性 理论 中 的 大 多 数 归 约 来 说 ， 它 已 经 够 用 了 。 例 如 在 定理 8.8 中 , 已 经 证 明了 每 一 个 
PSPACE 问题 在 多 项 式 时 间 内 归 约 到 TQBF。 在 归 约 过 程 中 产生 了 重复 度 高 的 公式 ， 它 们 
或 许可 在 对 数 空间 内 计算 ,因此 或 许可 以 得 出 结论 : 利用 对 数 空间 ，TQBF 是 PSPACE 
完全 的 。 这 个 结论 在 推论 9.6 中 证 明 NLG PSPACE 时 非常 有 用 。 这 种 分 离 和 对 数 空间 可 
归 约 性 表明 TQBFENL. 


8.6 NL 等 于 coNL 


本 节 包 含有 关 复 杂 性 类 之 间 相 互 关系 的 已 知 结果 中 最 惊人 的 结果 之 一 。 一 般 认为 NP 
与 coNP 是 不 相等 的 。 乍 一 看 ， 同 样 的 结果 对 于 NL 和 coNL 似乎 也 成 立 。 事 实 上 ， 正 如 
将 要 证 明 的 ，NL 等 于 coNL。 这 说 明 我 们 关于 计算 的 直觉 仍 有 许多 空白 。 

NL=coNL, 

证 明 思路 ”为 了 证 明 coNL 中 的 每 个 问题 也 在 NL 中 ， 先 证 明 PATH 属 于 NL， 因为 
PATH 是 NL 完全 的 。 所 给 出 的 判定 PATH 的 NL 算法 M 在 图 G 不 包含 从 Be 的 路 径 
时 ， 必 须 有 一 个 接受 计算 。 

首先 解决 一 个 容易 些 的 问题 。 令 c 是 G 中 从 s 可 达 的 结 点 数 。 假 定 c 作为 输入 提供 给 
M， 先 说 明 怎 样 利用 < 求解 PEAT 瓦 ， 然 后 再 说 明 怎 样 计 算 c 

给 定 G,s,t 和 c， 机 器 M 如 下 运算 。M 逐个 地 走 遍 G 的 所 有 m 个 结 点 ， 非 确定 地 猜 
测 每 个 结 点 是 否 从 s 可 达 。 一 旦 结 点 zx 被 猜测 为 可 达 ，M 就 通过 猜测 一 条 从 s Blu 的 路 径 
来 验证 这 一 点 。 如 果 一 个 计算 分 支 没 能 在 m 步 内 验证 这 一 猜测 (m 是 G 的 结 点 数 ) ， 就 拒 
绝 。 另 外 ， 如 果 一 个 分 支 猜测 t 可 达 ， 就 拒绝 。 机 器 M 对 那些 已 经 被 验证 为 可 达 的 结 点 计 
数 。 当 一 个 分 支 走 遍 G 的 所 有 结 点 后 ， 它 查验 从 s 可 达 的 结 点 数 是 否 等 于 c〈 即 实际 可 达 
的 结 点 数 ) ， 如 果 不 等 于 就 拒绝 。 否 则 该 分 支 接受 。 

换言之 ， 如 果 M 恰好 非 确 定 地 挑选 了 从 * 可 达 的 c 个 结 点 RO. HA 
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路 径 证 实 了 每 一 个 都 从 * AGA, WW MARIAH (RO 都 不 可 达 ， 所 以 它 就 可 
以 接受 。 

接 下 来 说 明 怎 样 计算 c BA s 可 达 的 结 点 数 。 描 述 一 个 非 确定 的 对 数 空 间 过 程 至 少 
有 一 个 计算 分 支 具有 正确 的 < 值 ， 而 所 有 其 他 分 支 都 拒绝 。 

对 于 从 0 到 m 的 每 个 值 i， 定义 A; 为 G 中 与 ; 的 距离 不 超过 i 的 结 点 的 集合 〈 即 从 s 
出 发 有 一 条 长 度 不 超过 i WI). FEAS {s}, BRA CA, An 包含 从 s 可 达 的 所 
Bim. Oo 是 A; 中 的 结 点 数 。 下 面 描 述 一 个 过 程 ， 从 ci 中 计算 出 ci;+1。 反 复 应 用 这 一 
过 程 ， 就 获得 所 需 的 值 c= cm o 

从 ci 中 计算 出 ci+1 所 用 的 思路 与 前 面 给 出 的 思路 相似 。 算 法 走 遍 G 的 所 有 结 点 ， 决 
定 每 一 个 结 点 是 否 为 Ai+1 的 成 员 ， 然 后 数 成 员 的 个 数 。 

为 了 判定 结 点 v 是 否 在 Ai+1 中 ， 用 一 个 内 层 循环 走 遍 G 的 所 有 结 点 ， 猜 测 每 一 个 结 
REBATE A; 中 。 每 一 次 成 功 的 猜测 是 由 猜测 一 条 从 s 出 发 、 长 度 至 多 为 i 的 路 径 来 证 实 。 
对 于 每 个 证 实 了 在 A; 中 的 结 点 w， 算 法 检查 (u,v) 是 否 是 G 的 一 条 边 。 如 果 是 其 中 的 一 
Ai, Wve AGP. AS, 证实 了 在 A; 中 的 结 点 的 数目 也 被 计算 出 来 。 在 内 层 循环 结 
RAT, WREKE TFA 的 结 点 总 数 不 等 于 ci ， 则 A; 的 全 部 结 点 还 没有 被 找 完 ， 所 以 该 计 
算 分 文 拒 绝 。 如 果 总 数 的 确 等 于 c, HEH wv 还 没有 证 实 属 于 A;4+1， 则 可 以 下 结论 说 它 不 在 
Ai+1 中 。 然 后 走 到 下 一 个 v。， 开 始 外 层 循环 。 

证 明 判定 PATH 的 算法 如 下 。 这 里 令 m 为 G 的 结 点 数 。 

M 王 “对 输入 (G,s,t): 





L Sei, = [Ao={ssA 1 个 结 点 ] 

2. 对 i=0 到 m 一 1; [从 ci 计算 ci+lj 

3. 令 ci+1 王 1。 [ci+1 计 数 在 Ain PHBA 

4. 对 G 中 的 每 个 结 点 v (ves): [检查 是 否 v€ A+: J 

5, 令 d=0, Ld 计数 A; 中 的 结 点 数 ] 

6. 对 G 中 的 每 个 结 点 4 : [检查 是 否 UC A; | 

7. 非 确定 地 执行 或 者 跳 过 下 列 步 又: 

8. 非 确 定 地 沿 着 从 s 出 发 、 长 度 至 多 为 i 的 路 径 行 进 ， 如 果 没 
有 碰 到 结 点 w， 就 拒绝 。 

9. d 加 1。 [u€ A; ] 

10. 如 果 (u,v) 是 G 的 一 条 边 ， 则 cawi v 变 为 下 一 个 结 
点 ， 转 回 步 又 5。 [ve Ai+ | 

if A d 关 c;， 则 拒绝 。 [检查 是 否 找 到 所 有 A; | 

12. $ d=0, [现在 已 知 cms d 计数 Am 中 的 结 点 数 ] 

13. 对 G 中 的 每 个 结 点 : [检查 是 否 u€ Anj] 

14.  ” 非 确 定 地 执行 或 跳 过 下 列 步骤 : 

15. 非 确 定 地 沿 着 从 s 出 发 、 长 度 至 多 为 m WKI., MRA MAA 

点 & 就 拒绝 。 
16. 若 x 一 上 *， 则 拒绝 。 [找到 从 s 到 + 的 路 径 ] 


17. d 加 1。 [uE Am | 
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18. HdAcm, Wie; AM, HZ.” [检查 是 否 找到 所 有 属于 A 的 结 点 


在 任何 时 刻 ， 本 算法 只 需 存 储 和 和 一 个 指 回 路 径 末 端的 指针 ， 所 以 
它 在 对 数 空间 内 运行 。( 注 意 : M 也 接受 格式 错误 的 输入 。) a 
把 当前 已 知 的 关于 几 个 复杂 性 类 之 间 相 互 关系 的 认识 总 结 如 下 : 


Lo NL = NLCEC PE NPC PSPACE 


我 们 还 不 知道 这 些 包 含 关 系 是 否 有 真 包含 ， 虽 然 在 第 9 WHC 9.6 中 将 证 明 NLG 
PSPACE® 。 所 以 ，coNLSEP #1 PG PSPACE 中 一 定 至 少 有 一 个 成 立 ， 但 是 不 知道 哪 一 个 
成 立 ! 大 多 数 人 研究 者 推 想 所 有 这 些 包 含 关 系 都 是 真 包含 。 


练习 


8.1 


8.2 


8.3 


8.4 
“8.5 
8. 6 
A8.7 


问题 


"8.8 


8.9 


证 明 对 于 任意 函数 f: NR, HP f(n) 宇 rn， 不 论 用 单 带 图 灵机 模型 还 是 用 双 带 只 读 输 入 图 
灵机 模型 ， 所 定义 的 空间 复杂 性 类 SPACE(f(n)) 总 是 相同 的 。 

考虑 下 面 标准 的 儿童 游戏 的 棋局 。 设 下 一 步 轮 到 X 方 选手 走 。 请 描述 该 选手 的 必 胜 策略 。( 回 忆 
前 边 所 学 内 容 ， 必 胜 策略 不 仅仅 是 在 当前 棋局 中 的 最 佳 走 步 ， 它 还 包括 该 选手 为 了 取胜 而 必须 
采取 的 所 有 应 手 ， 不 论 对 手 如 何 走 步 。) 


O x 
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略 吗 ? AF? 给 出 理由 。 


证 明 PSPACE 在 并 、 补 和 星 号 运算 下 封 财 。 
证 明 Apra E L. 

证 明 PSPACE 难 的 语言 也 是 NP 难 的 。 
证 明 NL 在 并 、 连 接 和 星 号 运算 下 封闭 。 


尼 姆 游戏 的 道具 是 几 堆 树枝 。 在 一 步 中 ， 选 手 从 一 个 堆 中 拿 走 至 少 一 根 树枝 。 选 手 们 轮流 交替 
地 拿 走 树 校 ， 拿 走 最 后 一 根 树枝 的 选手 算 输 。 假 设 在 尼 姆 的 一 个 局 势 中 有 上 &* 堆 树 校 ， 每 堆 分 别 
包含 5 ，… ,ss 根 树 校 。 如 果 把 每 个 数 s; 写成 二 进 制 形式 ， 并 且 每 个 二 进 制 数 排 成 矩阵 的 一 行 ， 
低位 对 齐 以 后 ， 每 一 列 包 含 偶 数 个 1， 则 称 局 势 是 平衡 的 。 证明 下 面 两 个 事实 : 

a. 从 一 个 非 平 衡 的 局 势 出 发 ， 存 在 一 步 使 得 局 势 变 成 平衡 的 。 

b. 从 一 个 平衡 的 局 势 出 发 ， 每 一 步 都 使 得 局 势 变 成 非 平衡 的 。 


4 


NIM = {((s ,se | 每 个 si 是 二 进 制 数 , 选 手工 在 尼 姆 游戏 中 从 该 局 势 出 发 有 必 胜 策略 ) 
利用 前 面 关 于 平衡 局 势 的 事实 证 明 NIM 属于 L. 
4 MULT= (at b#tcla.b.c 是 二 进 制 自然 数 且 aX6b=c}。 证明 MULTE L。 


© ASB 表示 A 是 B 的 真子 集 。 一 一 译 者 注 
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对 任意 正 整数 x, C2 BK cH-HABRRARBAMBA 〈 假 设 z 的 二 进 制 形式 首位 不 是 

0), @ XM RAR’ :N>N, EPR’ (zx) 二 x 十 xR。 

a. 4> Ar={ (zy YIR" (x) =y}, 证 明 As EL, 

b. © Az ={(x,y YIR" (R+ (1))=y}, WH AEL. 

a. & ADD=({(z,y,z)|z,y,2>0 且 为 二 进 制 整数 ， r+y=z}, WH ADDEL, 

b. $ PAL-ADD= {(z,y)|z,y>0 BAZH, rty 是 整数 且 其 二 进 制 表 示 是 回 文 ;。( 假 
设 求 和 的 结果 的 二 进 制 首位 不 是 0， 顺 读 和 倒 读 都 是 一 样 的 字符 串 称 为 回 文 .) 证 明 PAL- 
ADDEL。 

令 UCYCLE={((G )1G 是 包含 一 个 简单 回路 的 无 向 图 } ， 证 明 UCYCLEEL。( 注 : G 可 能 不 是 连 

ii Al.) 

证 明 对 每 个 z， 存 在 两 个 长 度 为 poly(n) HIEWRARRAS, HP LORAL(S), 但 它们 包含 

的 第 一 个 相 异 的 字符 串 是 指数 长 的 。 换 言 之 ，L(R) MLO 必须 是 不 同 的 ， 然 而 对 某 些 常量 

e>0, FSRBPNKEA 2 时 二 者 是 一 样 的 。 

如 果 无 向 图 的 结 点 可 以 分 成 两 个 集合 ， 使 得 所 有 边 都 从 一 个 集合 的 结 点 连 到 另 一 个 集合 的 结 

点 ， 则 该 无 向 图 称 为 二 部 的 〈bipartite) 。 证 明 一 个 图 是 二 部 的 当 且 仅 当 它 不 含有 奇数 个 结 点 的 






BIPARTITE = {(G) | G 是 二 部 图 } 
证 明 BIPARTITEENL., 
5 UPATH 是 无 向 图 中 PATH 的 对 偶 ,， 证 明 BIPARTITE<LUPATH 。( 注 : Exh O. Rein- 
goldL62] 中 证 明了 UPATH EEL， 因此 BIPARTITEEL, 但 其 算法 有 点 复杂 ,) 
回忆 一 下 ， 在 有 问 图 中 ， 如 果 每 一 对 结 点 间 都 有 双 疝 的 有 癌 路 径 连 接 ， 则 它 称 为 强 连 通 的 
(strongly connected), 4 

STRONGLY-CONNECTED = {(G) | G 是 强 连通 图 } 

证 明 STRONGLY-CONNECTED 是 NL 完全 的 。 
4 BOT Hyra = {(M, ,Mi )|M, M M: Æ NFA,L(M,) (1) L(0M2)4~@}. WH BOTHNFA 是 NL 完 
全 的 。 
证 明 ANFA 是 NL 完全 的 。 
证 明 Epra Æ NL 完全 的 。 
证 明 2SAT 是 NL 完全 的 。 
令 CNFH =p) lp 是 一 个 可 满足 的 cnf 公式 ， 其 中 每 个 子 句 包 含 任意 多 个 肯定 的 文字 ,但 最 多 
只 有 一 个 否定 的 文字 。 并 且 ， 每 个 否定 的 文字 在 $ 中 最 多 出 现 一 次 }。 证 明 CNFm 是 NNL ZX 
全 的 。 
给 出 一 个 是 NL 完全 的 上 下 无 关 语 言 。 
令 CYCLE={(G)|G 是 包含 一 个 有 问 回 路 的 有 问 图 }。 证 明 CYCLE 是 NL 完全 的 。 
令 EQrEx =í (R, S |R 和 S 是 等 价 的 正则 表达 式 }。 证 明 EQrEx € PSPACE。 
梯子 (ladder) 是 一 个 字符 串 的 序列 s ,sz,，…,s% ， 其 中 每 个 字符 串 与 前 一 个 字符 串 恰 好 只 在 一 
个 字母 上 不 同 。 例 如 ， 下 面 是 一 个 英文 单词 的 梯子 : 

head, hear, near, fear, bear, beer, deer, deed, feed, feet, fret, free 

4> LADDERpra = (4M, s,t)|M 是 一 个 DFA, LIM) 包含 一 个 以 字符 串 s HA, UFRPE 

结束 的 梯子 }。 证 明 LADDERpra JB PSPACE. 
五 子 棋 游戏 由 两 名 选手 “X” 和 “0O” 在 19X19 的 网 格 上 比赛 。 选 手 们 轮流 放 棋 子 ， 第 一 个 把 
自己 的 5 个 棋子 连续 地 放 在 一 行 、 一 列 或 者 一 条 对 角 线 上 的 选手 就 是 赢家 。 考 虑 把 该 游戏 推广 
到 nXn 棋 盘 上 。 > 

GM = {(B) | B 是 推广 的 五 子 棋 的 棋局 ,其 中 选手 “X” 有 必 胜 策略 } 
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这 里 的 棋局 是 指 放 有 一 些 棋 子 的 棋盘 ， 它 可 能 在 下 棋 的 过 程 中 出 现 。 
证 明 GME PSPACE, 
8.27 ”证明 如 果 每 一 个 NP 难 的 语言 也 是 PSPACE 难 的 ， 则 PSPACF=NP. 
8.28 ”证 明 当 限制 跟 在 量词 后 面 的 那 部 分 公式 是 合 取 范式 时 ，TQBF 仍 是 PSPACE 完全 的 。 
8.29 定义 Arpa={(M,w)|M 是 一 个 接受 输入 w 的 LBA), WH Arsa Æ PSPACE 完全 的 。 
“8.30 猫 捉 老鼠 游戏 由 两 名 选手 “ 猫 ” 和 “老鼠 ”在 一 个 任意 的 无 向 图 上 竞赛 。 在 给 定时 刻 ， 每 名 选 
手 占 据 图 的 一 个 结 点 。 选 手 们 轮流 走 到 与 当前 占据 的 结 点 相 邻 的 结 点 上 。 图 中 有 一 个 特殊 的 结 
点 称 为 “ 洞 >。 如 果 双 方 同 时 占据 同一 个 结 点 ， 则 猫 赢 。 如 果 老 鼠 在 此 之 前 到 达 洞 ， 则 老鼠 启 。 
如 果 双 方 同 时 到 达 以 前 占据 的 位 置 ， 则 为 平局 。 令 
HAPPY-CAT = {(G,c,m,;h) | Gecem, h 分 别 为 图 和 猫 的 人 位置、 老鼠 的 
位 置 和 洞 ,使 得 如 果 猫 先 走 , 则 猎 有 必 胜 策略 } 
证 明 HAPPY-CAT 属于 P。 
8.31 考虑 问题 7. 39 中 描述 的 语言 PUZZLE 的 双人 版 。 每 名 选手 开始 时 都 有 一 又 排 好 序 的 谜 卡 。 他 
们 轮流 地 按 序 把 卡片 放 进 盒子 ， 并 有 权 选 择 哪 一 面 朝 上 。 如 果 在 最 终 的 盒子 中 所 有 和 孔 的 位 置 都 
被 堵 住 了 ， 则 选手 工 赢 。 如 果 还 有 和 孔 的 位 置 没 被 堵 住 ， 则 选手 开 赢 。 证 明 对 于 给 定 的 卡片 的 起 
始 格局 ， 判 定 哪 位 选手 有 必 胜 策略 的 问题 是 PSPACE 完全 的 。 
8.32 理解 在 问题 7. 21 中 对 MIN- FORMULA 的 定义 。 
a. 证 明 MIN- FORMULA € PSPACE, 
b. 解释 下 面 的 论证 为 何不 能 证 明 MIN- FORMULA € coNP: 
如 果 gE MIN-FORMULA, ， 则 上 有 更 小 的 等 价 公式 。 一 个 非 确 定型 图 灵机 通过 猜测 这 个 等 
价 公 式 能 验证 yE MIN FORMULA. 
8.33 设 A 是 由 正确 舱 套 的 圆 括号 组 成 的 语言 。 例 如 ，(( )) 和 (()(()))() BFA. 而 )( 则 不 属于 
A. iE A BFL. 
* 8.34 KBE ERRKENRASAPRASARMB A. Bla, (LOL) BB, m (DIA 
属于 B. WH BFL. 
习题 选 解 
8.5 构造 一 个 图 灵机 M ŽE Anra. XFA (A w) (其 中 A 为 DFA，w 是 一 个 字符 串 )，M 在 ww 
上 模拟 A， 方法 是 通过 跟踪 A 的 当前 状态 和 输入 头 的 位 置 ， 并 适时 地 修改 它们 。 因 为 只 需要 存 
储 指 向 输入 的 指针 ， 所 以 完成 这 个 模拟 需要 的 空间 是 O(log n). 
8.7 4A, A 分 别 是 由 NL 机 器 Ni AN, 判定 的 语言 。 构 造 三 个 图 灵机 : Ny 判定 Al UA, No 


HEA OA, N, 判定 AT ， 每 个 图 灵机 的 输入 为 w 
图 灵机 Ny 不 确定 地 分 支 来 模拟 Ni 或 N;， 在 两 种 情况 下 ， 如 果 被 模拟 的 机 器 接受 ， 则 Nu 
接受 。 
图 灵机 No 不 确定 地 在 输入 串 中 选择 一 个 位 置 将 它 分 成 两 个 子 串 。 由 于 没有 足够 的 空间 存储 子 
串 ， 所 以 在 工作 带 上 只 存放 该 位 置 的 指针 。 首 先 ，Ne 在 第 一 个 子 串 上 模拟 Ni No 不 确定 地 分 
支 模拟 Ni 的 不 确定 性 。 在 其 中 任何 一 个 分 支 上 达到 Ni 的 接受 状态 后 ，No 在 第 二 个 子 串 上 模 
W Ne 。 如 果 其 任何 一 个 分 支 达 到 No 的 接受 状态 ， 则 No 接受 。 
机 器 N. 的 算法 比较 复杂 ， 下 面 描述 其 步骤 。 
N. 二 “对 于 输入 w: 

1. 初始 化 两 个 输入 位 置 指针 pi 和 ps， $ pi =0,p2=0, Bl pi 和 pz 指向 第 一 个 输入 字 

符 前 面 。 
2. Æ pz 之 后 无 输入 符号 则 接受 。 
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3. 向 前 移动 pz ， 非 确定 地 选择 一 个 输入 位 置 。 

4. 在 pi 和 pz 之 间 的 子 串 上 模拟 Ni ， 分 支 不 确定 地 模拟 Ni 的 不 确定 性 。 

5. 若 模拟 的 这 个 分 支 达 到 了 Ni 的 接受 状态 ， 则 令 加 三 加， 返回 步骤 2。 如 果 Ni 在 这 
个 分 支 上 拒绝 ， 则 拒绝 。” 

8.23 4 PATH ANZ) CYCLE。 归 约 的 思路 是 通过 在 图 G 上 添加 一 条 从 上 到 s 的 边 ， 从 而 修改 
PATH 问题 的 例子 〈《G,s,t)。 若 在 G 中 存在 一 条 从 s 到 + 的 路 径 ， 那 么 在 修改 后 的 G 中 就 存在 
一 个 有 向 回路 。 因 为 在 修改 前 的 G 中 或 许 已 经 存在 其 他 回路 ， 所 以 在 修改 后 的 GPRS Ms 到 
t 的 回路 外 ， 有 可 能 存在 其 他 回路 。 为 了 解决 这 个 问题 ， 首 先 要 修改 G， 使 之 不 包含 回路 。 引 入 
分 级 有 向 图 (leveled directed graph) 的 概念 ， 分 级 有 向 图 中 的 结 点 被 分 成 多 个 组 : Al ,A;,…， 
Ax， 每 个 组 称 为 一 个 级 ， 只 有 从 某 级 指向 比 本 级 高 一 级 的 边 才 是 允许 的 。 分 级 有 辕 图 中 是 没有 
回路 的 。 对 于 分 级 有 向 图 来 说 ， 根 据 下 面 给 出 的 非 受 限 PATH 问题 的 归 约 ， 可 知 PATH 问题 
仍 是 NL 完全 的 。 给 定 一 个 包含 m 个 结 点 的 有 向 图 G 以 及 结 点 s 和 t+， 产生 一 个 分 级 有 向 图 G ， 
该 图 中 的 级 是 G 中 结 点 的 m 个 拷贝 。 如 果 G 中 包含 从 结 点 i 到 7 的 边 ， 则 从 每 级 的 i 到 下 一 级 
的 7 画 一 条 边 。 除 此 之 外 ， 在 每 级 的 ;到 下 一 级 的 ; 之 间 画 一 条 边 。 令 是 s 在 第 一 级 的 对 应 结 
S, CEt 在 最 后 一 级 的 对 应 结 点 。 图 G 包 含 从 s 到 上 的 路 径 当 和 且 仅 当 G 包含 从 s ale 的 路 径 。 
如 果 修 改 G ， 在 其 中 增加 一 条 从 到 s 的 边 ， 则 得 到 了 从 PATH 到 CYCLE 的 归 约 。 这 个 归 约 
计算 是 很 简单 的 ， 并 且 其 完成 只 需要 对 数 空间 。 更 进一步 说 ， 一 个 直观 的 过 程 证 明了 CYCLEE 
NL。 综 上 所 述 ，CYCLE 是 NL 完全 的 。 
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某 些 计算 问题 在 理论 上 虽然 是 可 解 的 ， 但 是 获得 其 解 需 要 耗费 大 量 的 时 间或 空间 ， 导 
致 其 难以 在 实践 中 得 到 应 用 ， 这 样 的 问题 称 为 难 解 的 (intractable)。 

在 第 7、8 章 中 ,介绍 了 几 个 被 认为 是 难 解 的 问题 ,但 是 还 没有 一 个 得 到 证 明 。 例 如 ， 
虽然 还 不 知道 怎样 证 明 ， 但 大 多 数 人 相信 SAT 问题 和 其 他 所 有 NP 完全 问题 都 是 难 解 的 。 
本 章 给 出 几 个 能 够 被 证 明 是 难 解 的 问题 。 

为 了 给 出 这 些 例子 ， 先 证 明 几 个 定理 ， 将 图 灵机 的 能 力 与 计算 可 获得 的 时 间或 空间 数 
量 关联 起 来 。 在 本 章 的 最 后 ， 进 一 步 讨 论 了 证 明 NP 中 的 问题 是 难 解 的 可 能 性 ， 也 就 是 解 
He P 问题 与 NP 问题 的 可 能 性 。 首 先 ， 介 绍 相 对 化 技术 ， 利 用 它 来 证 明 采 用 某 些 方法 并 不 
会 达到 这 一 目标 。 然 后 ， 讨 论 一 种 被 研究 者 采用 并 已 显示 出 一 定 前 景 的 方法 一 一 电路 复杂 
性 理论 。 

9. 1 层次 定理 

通常 的 直觉 是 ， 给 图 灵机 更 多 的 时 间或 空间 就 能 扩大 它 所 能 求解 的 问题 类 。 人 例如， 在 
时 间 mn? 内 ， 图 灵机 应 能 比 在 时 间 n? 内 判定 更 多 的 语言 。 层 次 定理 (hierarchy theorem) 
证 明了 这 种 直觉 在 满足 某 些 条 件 下 的 正确 性 。 采 用 术语 层次 定理 ， 是 因为 这 些 定理 中 的 每 
一 个 都 证 明了 时 间 和 空间 复杂 性 类 不 全 相同 它们 形成 一 个 层次 结构 ， 其 中 时 空 界 限 较 
大 的 类 比 时 空 界限 较 小 的 类 包含 更 多 的 语言 。 

空间 复杂 性 层次 定理 比 时 间 复 杂 性 层次 定理 稍 简单 一 些 ， 故 首先 介绍 它 。 在 实际 陈述 
定理 之 前 ， 引 入 下 面 的 定义 。 

对 于 函数 fN >N, HP f(n) 2H Ologn), RBM f tel" 映射 为 
fn) 的 二 进 制 表示 ， 并 且 该 函数 在 空间 OSa) 内 是 可 计算 的 9 ， 则 称 该 函数 为 空间 可 
构造 的 〈space constructible), 

换言之 ， 如 果 存 在 某 个 图 灵机 在 O(f(n)) 空间 内 运行 ， 而 且 在 输入 1” 时 总 能 停机 ， 
停机 时 fin) 的 二 进 制 表示 出 现在 带子 上 ， 则 f 是 空间 可 构造 的 。 为 了 具备 时 间 和 空间 可 
构造 性 ， 如 n logzn 和 vn 这 一 类 带 小 数 的 函数 被 向 下 舍 人 到 紧邻 的 较 小 的 整数 上 。 

通常 出 现 的 复杂 度 至 少 为 O(logn) 的 函数 都 是 空间 可 构造 的 ， 包 括 logzm， 
n logon Fil n? 。 

例如 ，n? 是 空间 可 构造 的 ， 因 为 机 器 以 1” 为 输入 ， 通 过 数 1 的 数目 得 到 的 二 进 制 
形式 ， 采 用 标准 的 方法 将 nn AR, Wh n? 。 全 部 空间 消耗 是 O(n)， 当 然 也 是 O). 

当 证 明 等 于 ol(n) 的 函数 fn) 是 空间 可 构造 的 时 ， 如 同 在 8. 4 节 和 定义 亚 线性 空间 复 
杂 性 那样 ， 有 一 条 单独 的 只 读 输入 带 。 例 如 ， 这 种 机 器 可 以 如 下 计算 把 1" 映射 为 logzn 的 





O 其中，1” 的 意思 是 n 个 1 的 字符 串 。 
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二 进 制 表示 的 函数 。 随 着 只 读 头 沿 着 输入 带 移动 ， 它 在 工作 带 上 以 二 进 制 形式 计算 输入 中 
1 的 数目 。 然 后 ， 因 为 n 以 二 进 制 形式 放 在 工作 带 上 ， 故 它 通过 数 n 的 二 进 制 表 示 中 的 位 
RAT Wit H logan. 及 

从 下 面 的 讨论 中 可 以 理解 空间 可 构造 性 在 空间 层次 定理 中 的 作用 。 若 f(n) 和 gi) 
是 两 个 空间 界限 ，f(n) 渐 近 地 比 ga 大 ， 则 机 器 在 fna) 空间 内 所 能 判定 的 语言 比 在 
g(n) 空 间 内 多 。 然 而 ， 假 如 fin) 超过 ein) 的 那 部 分 数量 非常 小 而 且 难 以 计算 ， 和 那么 机 
器 可 能 无 法 有 效 地 利用 多 出 来 的 那 部 分 空间 ， 因 为 仅 是 计算 多 出 来 的 空间 数量 所 需 消 耗 的 
空间 就 可 能 比 所 获得 的 空间 还 要 多 。 在 这 种 情况 下 ， 机 器 在 f(n) 空间 内 所 能 计算 的 语言 
不 会 比 在 gin) 空间 内 更 多 。 规 定 f(n) 是 空间 可 构造 的 就 可 避免 这 种 情况 ， 这 样 就 可 以 
证 明 ， 机 器 所 能 计算 的 语言 比 它 在 任何 渐 近 更 小 的 界限 内 所 能 计算 的 语言 更 多 ， 如 下 面 的 
定理 所 示 。 

(空间 层次 定理 ) 对 于 任何 空间 可 构造 函数 f:N 一 N， 存 在 语言 A， 在 空 
间 OCf(n)) 内 可 判定 ， 但 不 能 在 空间 o(f(n)) 内 判定 。 

证 明 思 路 ”必须 说 明 一 个 语言 A 具有 两 个 性 质 : 第 一 ，A 在 O(CFGz)) 空间 内 可 判定 ， 
第 二 ，A 不 能 在 oC(f(n)) 空间 内 判定 。 

通过 给 出 判定 算法 D 来 描述 A。 算 法 DD 将 在 OC(f(n))) 空间 内 运行 ， 从 而 保证 了 第 
一 个 性 质 。 进 而 ， 将 保证 A 不 同 于 任何 在 o(f(n))〉 空间 内 可 判定 的 语言 ， 从 而 保证 了 
第 二 个 性 质 。 不 要 指望 语言 A 能 够 像 迄今 为 止 本 书 中 介绍 的 其 他 语言 那样 ， 有 一 幅 简单 明 
了 的 图 像 。 语 言 A 只 能 通过 算法 来 描述 ， 没 有 更 简单 的 、 非 算法 的 定义 。 

为 保证 A ARETE oC f(n)) 空间 内 判定 ， 设 计 D 用 以 实现 定理 4.9 中 证 明 接 受 问 题 
ATM 不 可 解 时 所 采用 的 对 角 线 法 。 如 果 M 是 在 o(f(n)) 空间 内 判定 一 个 语言 的 图 灵机 ， 
WW DREA 与 M 的 语言 至 少 存在 一 点 不 同 的 地 方 。 是 哪个 地 方 ? 就 是 对 应 于 描述 M 自己 
的 地 方 。 

看 一 看 了 的 运算 方式 。 简 单 地 讲 ， 把 它 的 输入 看 作 是 图 灵机 M 的 描述 。( 如 果 输 入 
不 是 任何 图 灵机 的 描述 ， 则 D 在 该 输入 上 的 动作 是 无 意义 的 ， 所 以 武断 地 让 D 拒绝 即 
可 。) 然后 DD 在 同一 输入 ( 即 (M) 上 在 空间 界限 fn) 内 运行 M。 如 果 M 在 这 么 大 空 
间 内 停机 ， 则 DRS4AM4M 拒绝 。 如 果 M 不 停机 ， 则 D 拒绝 。 所 以 如 果 M 在 空间 
fn) 内 运行 ， 则 DD 有 足够 的 空间 保证 它 的 语言 不 同 于 M 的 语言 。 否 则 ，D 没有 足够 的 空 
间 算 出 M 的 结果 。 但 幸运 的 是 ， 并 没有 要 求 D 的 行为 与 不 能 在 oC(f(n)) 空间 内 运行 的 机 
器 不 同 ， 所 以 D 在 该 输入 上 的 动作 是 无 关 紧 要 的 。 

该 描述 抓 住 了 证 明 的 本 质 ， 但 忽略 了 几 个 重要 的 细节 。 如 果 M 在 o(f(n)) 空间 内 运 
行 ， 则 D 必须 保证 它 的 语言 不 同 于 M 的 语言 。 但 是 即使 M Eola) 空间 内 运行 ， 它 也 
可 能 对 于 小 的 n 消耗 比 f(n) 多 的 空间 ， 只 要 这 种 渐 近 行为 还 没有 “消亡 ”，D 就 有 可 能 
没有 足够 的 空间 在 输入 〈M》 上 把 M 运行 完 ， 从 而 使 D 失去 一 次 避 开 M 的 语言 的 机 会 。 
于 是 ， 一 不 小 心 ，D 就 可 能 与 M 判定 同一 语言 ， 从 而 定理 无 法 得 证 。 

通过 修改 D， 给 它 另 外 的 机 会 来 避 开 M 的 语言 可 以 弥补 这 一 问题 。 不 是 只 在 D 收 到 
输入 《M》 时 才 运 行 M， 而 是 只 要 收 到 形式 为 〈《M 10* WWA, MÆ (M) 后 面 跟着 
一 个 1 和 一 些 0 的 输入 ， 就 运行 M。 那 么 ， 如 果 M 真 的 在 O(f~™) 空间 内 运行 ， 则 由 于 渐 
近 行 为 最 终 肯 定 是 要 消亡 的 ， 所 以 对 于 某 个 大 的 & 值 ， DD 将 有 足够 的 空间 在 输入 “M0)10* 上 
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把 M 运行 完 。 

最 后 一 个 技术 问题 是 ， 当 厂 在 某 个 字符 串 上 运行 M 时 ，M 可 能 陷 和 人 死 循环 而 占用 有 
穷 空间 。 但 是 D 应 该 是 一 个 判定 机 ， 所 以 必须 保证 DD 在 模拟 1M 时 不 会 循环 。 任 何在 空间 
o(f(n)) 内 运行 的 机 器 只 消耗 2°U™ ATT. AD, 使 它 计 算 在 模拟 M 中 用 掉 的 步 数 。 
如 果 计 数 超过 25 ， 则 D 拒绝 。 

证 明 FEOS) 空间 算法 D 判定 的 语言 A 不 能 在 oC(f(n)) 空间 内 判定 。 

万 一“ 对 输入 w: 

l. 令 n 是 w 的 长 度 。 

2. 利用 空间 可 构造 性 计算 f(n)， 并 划分 出 这 么 多 带子 空间 。 如 果 后 面 的 步骤 企 
图 使 用 更 多 的 空间 ， 就 拒绝 。 

3. 如 果 双 不 是 形 如 〈(M)10* ， 其 中 M 是 某 个 图 灵机 ， 则 拒绝 。 

4. 在 w 上 模拟 M， 同 时 计算 模拟 过 程 中 使 用 的 步 数 。 如 果 计 数 超过 2/"… ， 则 拒绝 。 

5. @ MHZ, ME., GMS, WHE”. 

FER 4, ATRMEARNSARE, BPABHARHRWAD. RRUH MA 
任意 的 带子 字母 表 ， 而 DD 有 固定 的 带子 字母 表 。 所 以 用 D 的 带子 上 的 几 个 单元 来 表示 M 
的 带子 上 的 一 个 单元 。 因 此 模拟 过 程 在 消耗 的 空间 上 增加 了 一 个 常数 倍 的 开销 。 换 言 之 ， 如 
RME gan) 空间 内 运行 ， 那么 DD 需要 dg(n) 空间 来 模拟 M， 其 中 4 是 依赖 于 M 的 常数 。 

D 的 每 一 步 都 在 有 限时 间 内 运行 ， 所 以 D 是 一 个 判定 机 。 设 A 是 D 判定 的 语言 。 显 
然 ， 因 为 万 的 缘故 ，A 是 在 空间 OC(fln)) 内 可 判定 的 。 下 面 ,， 证 明 A 不 是 在 oC(f(n)) 空 
间 内 可 判定 的 。 

假定 其 反面 成 立 ， 即 某 个 图 灵机 M 在 空间 gn) 内 判定 A， 其 中 g(n) 等 于 o(f(n))。 
如 前 面 所 提 ，D 可 以 在 空间 dem 内 模拟 M， 其 中 4 是 某 个 常数 。 因 为 g(n) 等 于 ol(f(n))， 
所 以 存在 某 个 常数 no ， 使 得 dg(n) 二 fl(n) 对 所 有 n>n 成 立 。 因 此 只 要 输入 的 长 度 不 小 
于 no，D 对 MM 的 模拟 就 能 运行 完 。 考 虑 也 在 输入 (M) 10"。 上 运行 时 的 情况 。 该 输入 比 
no 长 ， 所 以 第 4 步 的 模拟 可 以 完成 。 因 此 D 与 M 在 同一 输入 上 的 判定 结果 相反 。 于 是 M 
不 判定 A ， 这 与 假设 矛盾 。 所 以 A 不 是 在 o(f(n)) 空间 内 可 判定 的 。 a 

对 于 任意 两 个 函数 fi, fo:NoN, HP f1(n) 等 于 ol(f2(n))，f2 是 空间 
可 构造 的 ， 有 SPACE( fi (n))S SPACE( f2(n))® 。 

该 推论 允许 把 不 同 的 空间 复杂 性 类 彼此 分 开 。 例 如 ， 容 易 证 明 对 于 任何 自然 数 c， 函 数 
n 是 空间 可 构造 的 。 因 此 对 于 任意 两 个 自然 数 cl 二 cz ， 可 以 证 明 SPACE: )& SPACE: ) 。 
再 做 一 点 努力 就 可 以 证 明 对 于 任何 有 理 数 ce, n 是 空间 可 构造 的 ， 从 而 把 前 面 的 包含 
关系 推广 到 对 任何 有 理 数 0 二 ci 二 cz 都 成 立 。 注 意 到 在 任何 两 个 实数 sa 二 ez 之 间 总 存在 两 
个 有 理 数 cl 和 cz 使 得 el 二 ci 二 cz 二 ez 。 于 是 得 到 下 面 补充 的 推论 ， 它 表明 在 PSPACE 类 
中 存在 一 个 良好 的 层次 结构 。 

对 于 任意 两 个 实数 0 二 el Ke, A 

SPACE(ns ) G SPACE(n® ) 
也 可 以 用 空间 层次 定理 来 分 离 前 面 碰 到 的 两 个 空间 复杂 性 类 。 


© “回忆 一 下 ASB 表 示 A 是 B 的 真子 集 。 
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NL & PSPACE, 

WEAR OY 4E At ee FE LAK NLC SPACE (log’n), 25 E Yk E BREA SPACE (log?) 
SPACE(n), ， 所 以 推论 成 立 。 z 

正如 在 8.5 节 末 所 说 的 那样 ， 就 对 数 空间 可 归 约 性 而 言 ，TQBF 是 PSPACE 完全 的 ， 
所 以 TQBFENL. 

现在 建立 本 章 的 主要 目标 : 证 明 存 在 理论 上 可 判定 而 实际 中 不 可 判定 的 问题 ， 即 可 
判定 而 难 解 的 问题 。 每 一 个 类 SPACE(mw) 包含 在 类 SPACE) 中 ， 后 者 又 严格 包 
含 在 类 SPACE(2") 中 。 所 以 得 到 下 面 补充 的 推论 ， 把 PSPACE 与 EXPSPACE= U: 
SPACE(2” ) 分 开 。 


PSPACE Ç EXPSPACE。 

就 判定 过 程 必须 消耗 多 于 多 项 式 的 空间 这 一 意义 而 言 ， 该 推论 证 明 存 在 难 解 的 但 可 判 
定 的 问题 。 语 言 本 身 有 一 些 不 太 自 然 一 一 它们 只 是 为 了 分 离 复 杂 性 类 才 有 意义 。 在 讨论 时 
间 层 次 定理 以 后 ， 利 用 这 些 语言 来 证 明 其 他 更 加 自然 的 语言 的 难 解 性 。 

对 于 函数 1:N->N， 其 中 zz) ZVA O(n logn), wA hke 1" 映射 为 
t(n) 的 二 进 制 表示 ， 并 在 时 间 OCt(n)) 内 可 计算 ， 则 称 该 函数 为 时 间 可 构造 的 〈time 
constructible) 。 

换言之 ， 如 果 存 在 某 个 图 灵机 ， 在 时 间 OGC) 内 运行 ， 而 且 在 输入 1* 上 启动 后 总 
能 停机 ， 停 机 时 上 zz) 的 二 进 制 表示 出 现在 带子 上 ， 则 上 是 时 间 可 构造 的 。 

通常 出 现 的 不 小 于 nlogn 的 函数 都 是 时 间 可 构造 的 ， 包 括 函 数 nlogn, nyn, 
n* 以 及 2". 

例如 ， 为 了 证 明 nyn 是 时 间 可 构造 的 ， 首 先 设 计 一 个 图 灵机 ， 以 二 进 制 计 算 1 的 个 
数 。 为 此 该 图 灵机 沿 着 带子 移动 一 个 二 进 制 计 数 器 ， 每 到 一 个 输入 位 置 就 把 它 加 1， 直 至 
输入 的 末端 。 因 为 对 于 nn 个 输入 位 置 的 每 一 个 都 需要 消耗 O(logn) 步 ， 所 以 这 部 分 工作 消 
# O(n logn) 步 。 然 后 ， 从 nn 的 二 进 制 表 示 中 计算 出 Ln wz | 的 二 进 制 形式 。 因 为 涉及 的 数 
HKEE O(logn)， 所 以 任何 合理 的 计算 方法 都 将 消耗 O(nlogn) 时 间 。 要 

时 间 层 次 定理 是 定理 9.3 相对 于 时 间 复 杂 性 的 类 似 定理 。 因 为 在 证 明 中 出 现 的 技术 上 
的 缘故 ， 时 间 层 次 定理 比 已 证 明 的 空间 层次 定理 稍 弱 。 任 何 空 间 可 构造 的 空间 界限 的 渐 近 
增加 都 将 扩大 可 判定 的 语言 类 。 与 之 不 同 ， 对 于 时 间 ， 为 了 保证 获得 更 多 的 语言 ， 必 须 进 
一 步 把 时 间 界 限 扩大 一 个 对 数 倍 才 行 。 可 以 想象 ， 更 紧 的 时 间 层 次 定理 也 成 立 ， 但 是 目前 
还 不 知道 怎样 证 明 它 。 时 间 层 次 定理 具有 这 一 特点 是 因为 我 们 用 单 带 图 灵机 度量 时 间 复 杂 
性 。 可 以 对 其 他 计算 模型 证 明 更 紧 的 时 间 层 次 定理 。 

(时 间 层 次 定理 ) 对 于 任何 时 间 可 构造 函数 上:N->N， 存 在 语言 A， 在 时 
间 O@(n)) 内 可 判定 ， 但 在 时 间 o(t(n)/logt(n)) 内 不 可 判定 。 

证 明 思 路 ”本 定理 的 证 明 类 似 于 定理 9.3 的 证 明 。 构 造 一 个 图 灵机 DD 在 时 间 OCz(n)) 
内 判定 语言 A， 而 A 不 能 在 时 间 o(¢(n)/loge(n)) 内 被 判定 。 这 里 ，D 读 取 一 个 形 如 (M0)10* 的 
输入 w， 模 拟 M 在 输入 w 上 的 运行 ， 确 保 时 间 消耗 不 超过 上 xz) 。 如 果 M 停机 的 时 间 在 这 
之 内 ， 则 D 给 出 相反 的 输出 。 

证 明 中 重要 的 差别 涉及 模拟 M 的 开销 以 及 计算 模拟 所 使 用 的 步 数 的 开销 。 机 器 D 必 
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须 有 效 地 执行 这 种 定时 的 模拟 ， 以 使 D 在 时 间 O(i(n)) 内 运行 的 同时 ， 避 开 所 有 在 
o(t(n)/logt(n)) 时 间 内 可 判定 的 语言 。 对 于 空间 复杂 性 ， 正 如 在 定理 9.3 的 证 明 中 所 注 
意 到 的 ， 这 种 模拟 增加 了 一 个 常数 倍 的 开销 。 对 于 时 间 复 杂 性 ， 这 种 模拟 增加 一 个 对 数 倍 
的 开销 。 时 间 需 要 更 大 的 开销 是 因为 在 本 和 定理 陈述 中 出 现 了 1/logt(n) 因子 。 假 如 有 一 种 
办 法 用 一 台 单 带 图 灵机 模拟 男 一 台 单 带 图 灵机 运行 预先 设 定 的 步 数 ， 而 在 时 间 上 只 增加 常 
数 们 开销， 我 们 就 可 以 加 强 本 定理 ， 把 ol(i(n)/logi(n)) 变 为 oli(n))。 但 是 尚 不 知道 如 此 
高 效率 的 模拟 。 
证 明 FEK OG) 时 间 算 法 D 所 判定 的 语言 A 不 是 在 ol(i(n)/logt(n)) 时 间 内 
可 判定 的 。 
D 二 “对 输入 w: 
1. 令 n 是 w 的 长 度 。 
2. 利用 时 间 可 构造 性 计算 t(n), FEA t(n)/log(n) | FRE — PR HE tT BE o 
在 每 一 次 执行 步骤 4、5 之 前 ， 把 该 计数 器 减 1。 如 果 计 数 器 减 到 0， 就 拒绝 。 
3. FwhBRAAE (M)10*, HP M 是 某 个 图 灵机 ， 则 拒绝 。 
4. 在 w 上 模拟 MM， 
5. 若 M 接受 ， 则 拒绝 ; AMI, WHS.” 
考察 该 算法 的 每 一 步 以 确定 运行 时 间 。 步 骤 1、2、3 能 够 在 O(i(n)) 时 间 内 完成 。 
在 步骤 4， 每 次 D 模拟 M 的 一 步 ， 它 都 要 读 取 M 的 当前 状态 以 及 M 读 写 头 下 的 市 子 
符号 ， 在 M 的 转移 函数 中 查找 M 的 下 一 个 动作 ， 以 使 它 能 够 适当 地 更 新 M 的 带子 内 容 。 
所 有 这 三 个 对 象 〈 状 态 、 带 子 符号 和 转移 函数 ) 都 存放 在 DD 的 带子 上 的 茶 处 。 如 果 它 们 彼 
此 分 开 很 远 ， 则 D 每 次 模拟 M 的 一 步 都 需要 走 许多 步 来 收集 这 些 信 息 。 所 以 ，D 总 是 把 
这 些 信息 放 在 一 起 。 
可 以 把 DD 的 单 带 组 织 成 轨道 。 得 到 两 条 轨道 的 一 种 方法 是 以 奇数 位 置 存 储 一 条 轨道 ， 
以 偶数 位 置 存储 另 一 条 轨道 。 另 一 种 获得 两 条 轨道 效果 的 方法 是 扩大 的 带子 字母 表 ， 使 
它 包 括 每 一 对 符号 : 一 个 符号 来 自 上 轨道 ， 另 一 个 符号 来 目下 轨道 。 更 多 的 轨道 效果 也 可 
以 类 似 获 得 。 注 意 ， 如 果 只 使 用 固定 数目 个 轨道 ， 多 轨道 就 只 增加 一 个 常数 倍 的 时 间 开 
销 。 这 里 ，DD 采用 三 条 轨道 。 
第 一 条 轨道 存储 M 的 带子 内 容 ， 第 二 条 轨道 包含 M 的 当前 状态 和 转移 函数 的 副本 。 
在 模拟 过 程 中 ，D 将 信息 保持 在 第 二 条 轨道 上 ， 靠 近 第 一 条 轨道 上 M 的 读 写 头 的 当前 位 
置 。 每 次 M 移动 读 写 头 时 ,，D 搬 动 第 二 条 轨道 上 的 所 有 内 容 ， 使 它 靠 近 该 读 写 头 。 第 二 
条 轨道 上 信息 的 长 度 仅 依赖 于 M， 而 不 依赖 于 M 的 输入 的 长 度 ， 所 以 搬 动 操作 只 使 模拟 
时 间 增 加 常数 倍 。 进 一 步 讲 ， 所 需 的 信息 都 靠 得 很 近 ， 所 以 在 转移 函数 中 查找 M 的 下 一 
个 动作 并 更 新 带子 内 容 的 开销 就 只 是 个 常数 。 因 此 ， 如 果 M 在 g(z) 时 间 内 运行 ， 就 能 
在 O(g(n)) 时 间 内 模拟 它 。 
在 步骤 4 的 每 一 步 ，D 必须 把 原先 在 步骤 2 中 设置 的 步 数 计数 器 减 1。 这 里 ，D 可 以 
在 不 显著 增加 模拟 时 间 的 条 件 下 完成 这 一 操作 ， 这 只 需 把 二 进 制 计数 器 存放 在 第 三 条 轨道 
上 ， 并 使 它 保持 靠近 当前 读 写 头 的 位 置 。 该 计数 器 的 量 值 大 约 是 4z)V/logt(Cz) ， 所 以 它 的 
长 度 是 log(t(n)/logt(n)), BI O(logt(n))。 因 此 在 每 一 步 ， 更 新 和 移动 它 给 模拟 时 间 增 加 
i(n) /logt(n) 倍 的 开销 ， 于 是 使 得 全 部 运行 时 间 达 到 OCz(n))。 所 以 A 是 O(t(n)) HAA 
可 判定 的 。 
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为 了 证 明 A 不 是 o(t(n)/logt(n)) 时 间 内 可 判定 的 ， 采 用 类 似 于 和 定理 9. 3 的 证 明 中 所 
使 用 的 推理 。 假 定 其 反面 成 立 ， 即 存在 图 灵机 M 在 时 间 g(a) WHEA, Bgn) 等 于 
ol(t(n)/logt(n))。 这 里 ，D 能 够 在 时 间 dg (n) 内 模拟 M, 其 中 d 是 某 个 常数 。 如 果 全 部 模 
拟 时 间 (不 包括 更 新 步骤 计数 器 的 时 间 ) 最 多 是 i:(n)/logi(n)， 则 模拟 过 程 可 以 完成 。 因 
H gn) 等 于 oli(n)/logt(n))， 所 以 存在 某 个 常数 nh， 使 得 对 n>n, dg(n)<t(n)/logt(n). 
因此 只 要 输入 的 长 度 不 小 于 n, DX M 的 模拟 就 可 以 完成 。 考 虑 DD 在 输入 《M)10% 上 运行 
时 发 生 的 情况 。 该 输入 比 no 长 ， 所 以 步骤 4 的 模拟 过 程 可 以 完成 。 因 此 D 与 M 在 同一 输入 
上 的 判定 结果 相反 ， 于 是 M 不 判定 A， 这 与 假设 矛盾 。 所 以 A 不 是 时 间 o(i(n)/logi(n)) 内 
可 判定 的 。 a 

对 时 间 复 杂 性 建立 类 似 于 推论 9. 4，9.5 和 9.7 的 推论 。 

a FEE BY BH titz: N>N, HP a(n) 等 于 oltzs (n)/logtz (n)) 而 
At 是 时 间 可 构造 的 ， 有 TIME(ti (n))S TIME: (n)). 

(aes 对 于 任意 两 个 实数 Ke 二 ez ， 有 TIME (ns )G TIME(n® ) 。 

PG EXPTIME, 
指数 空间 完全 性 

利用 前 面 的 结果 ， 可 以 证 明 一 个 具体 的 语言 事实 上 是 难 解 的 。 证 明 过 程 分 成 两 步 。 首 
先 ， 层 次 定理 说 明 图 灵机 在 EXPSPACE 内 比 在 PSPACE 内 判定 更 多 的 语言 。 然 后 ， 证 明 
有 关 广 义 正 则 表达 式 的 一 个 具体 的 语言 是 EXPSPACE 完全 的 ， 因 此 不 能 在 多 项 式 时 间 内 
(其 至 不 能 在 多 项 式 空间 内 ) 判定 。 

在 推广 正则 表达 式 之 前 ， 先 简要 回顾 一 下 定义 1. 26 中 正则 表达 式 的 定义 。 它 们 是 从 
原子 表达 式 名 ，e 以 及 字母 表 中 的 符号 出 发 ， 通 过 运用 正则 运算 构造 起 来 的 。 这 些 正则 运 
算 包 括 并 、 连 接 和 星 号 ， 分别 用 UU ,。 和 x 表示。 从 问题 8. 24 可 知 ， 可 以 在 多 项 式 空间 内 
判定 两 个 正则 表达 式 的 等 价 性 。 

下 边 将 证 明 ， 如 果 人 允许 正则 表达 式 采 用 比 通常 的 正则 运算 更 多 的 运算 ， 则 分 析 表 达 式 的 
复杂 性 将 急剧 上 升 。 设 个 是 指数 运算 (exponentiation operation), # R 是 一 个 正则 表达 式 ，& 
是 一 个 非 负 整 数 ， 则 写法 Rk 等 价 于 R 自身 连接 次。 也 可 把 Rk 缩写 为 Re。 换言之 ， 


pounne en 
Rt = RAkR=RoeRoe oR 

广义 正则 表达 式 允 许 指 数 运算 ， 也 允许 通常 的 正则 运算 。 显 然 ， 广 义 正则 表达 式 仍 然 

产生 正则 语言 ， 跟 标准 正则 表达 式 一 样 。 通 过 重复 基本 的 正则 运算 表达 式 ， 可 以 除去 指数 
PQREx+ = (QR) | Q 和 尺 是 等 价 的 带 指数 运算 的 正则 表达 式 》 

为 了 证 明 EQrexs 是 难 解 的 ， 可 以 证 明 它 对 于 类 EXPSPACE 是 完全 的 。 任 何 
EXPSPACE 完 全 问题 都 不 可 能 在 PSPACE 中 ， 更 不 用 说 PP 了。 否则 EXPSPACE 将 等 于 
PSPACE, 与 推论 9.7 FHE. 

语言 BX EXPSPACE 完全 的 ， 如 果 

1. BEEXPSPACE， 并 且 

2. EXPSPACE 中 的 每 个 A 都 多 项 式 时 间 可 归 约 到 吾 。 
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EQrexs 是 EXPSPACE 完全 的 。 
证 明 思 路 ”在 度量 EQrx 的 复杂 性 时 ， 假 定 所 有 指数 都 写成 二 进 制 整数 。 表 达 式 的 
长 度 是 它 包含 的 所 有 符号 的 总 数 。 
接 下 来 概略 地 叙述 判定 EQREx+ 的 EXPSPACE 算法 。 为 了 判定 两 个 带 指数 的 表达 式 
是 否 等 价 ， 首 先 用 重复 表达 式 的 办 法 删除 指数 ， 然 后 把 得 到 的 表达 式 转化 为 NFA。 最 后 
再 利用 一 个 类 似 于 例 8. 4 中 判定 ALLNFA 的 算法 的 NFA 等 价 性 判定 过 程 。 
为 了 证 明 EXPSPACE 中 的 语言 A 多 项 式 时 间 可 归 约 到 EQrEext ， 利 用 5.1 节 介绍 的 
利用 计算 历史 的 归 约 技巧 ， 其 构造 类 似 于 定理 5. 10 的 证 明 中 给 出 的 构造 。 
给 定 一 个 判定 A 的 图 灵机 M， 设 计 一 个 多 项 式 时 间 归 约 ， 把 输入 w 映射 为 一 对 表达 
AR 和 R;， 使 得 它们 等 价 当 且 仅 当 M 接受 w。 表 达 式 R AR. 模拟 M 在 w 上 的 计算 。 
表达 式 Ri 产生 计算 历史 中 可 能 出 现 的 符号 组 成 的 所 有 字符 串 。 表 达 式 Rs 产生 所 有 不 代表 
拒绝 计算 历史 的 字符 串 。 于 是 ， 帮 图 灵机 接受 输入 ， 就 不 会 有 拒绝 计算 历史 存在 ， 表 达 式 
R: Al R 将 产生 同一 个 语言 。 回 忆 一 下 ， 一 个 拒绝 计算 历史 就 是 机 器 在 输入 上 进入 拒绝 计 
算 的 格局 序列 。 参 见 5. 1 节 有 关 计 算 历 史 的 介绍 。 
本 证 明 的 难点 在 于 所 构造 的 表达 式 的 长 度 必 须 是 n 的 多 项 式 〈 以 使 归 约 能 够 在 多 项 式 
时 间 内 运算 )， 而 模拟 计算 的 长 度 可 能 是 指数 的 。 这 时 指数 运算 就 有 助 于 用 相对 短 的 表达 
式 表示 长 的 计算 。 
证 明 首先 给 出 一 个 非 确定 的 算法 ， 判 定 两 个 NFA 是 否 等 价 。 
N= 二 “对 输入 《Ni1i,N2，， 其 中 和 NN 和 N; Æ NFA: 
1. 给 Ni 和 NN; 的 起 始 状态 打上 标记 。 
2. 重复 下 面 的 操作 2272 Kk, Hg, Ag, 是 Ni 和 N: 的 状态 数 。 
3. 非 确 定 地 选择 一 个 输入 符号 ， 改 变 在 Ni 和 N: 的 状态 上 标记 的 位 置 ， 以 模拟 
读 入 这 个 符号 。 
4. 大 在 任何 时 刻 ， 标 记 放 在 一 个 有 穷 自 动机 的 接受 状态 上 ， 而 没有 放 在 另 一 个 有 
穷 目 动机 的 接受 状态 上 ， 则 接受 ; 否则 拒绝 。” 
如 采 目 动机 Ni 和 Ne 是 等 价 的 ，N 显然 拒绝 ， 因 为 它 只 在 确定 一 台 机 器 接受 某 个 串 
而 男 一 台 机 器 不 接受 时 才能 接受 。 如 果 这 两 个 自动 机 不 等 价 ， 则 存在 某 个 字符 串 被 一 台 机 
锋 接 受 而 不 能 被 男 一 台 接 受 。 这 样 的 字符 串 中 必定 有 长 度 不 超过 2t W BAR, SE 
用 这 样 的 串 中 最 短 的 一 个 作为 非 确 定 选择 的 序列 。 因 为 只 存在 2%*%; 种 不 同 的 方式 把 标记 
放 在 Ni 和 N: 的 状态 上 ， 所 以 在 更 长 的 字符 串 中 标记 的 位 置 必定 重复 。 把 介 于 重复 之 间 
的 那 部 分 字符 串 删除 ， 就 得 到 更 短 的 字符 串 。 因 此 算法 六 在 它 的 非 确 定 选 择 中 会 猜 到 这 
个 串 并 接受 。 所 以 NN 运算 正确 。 
算法 六 在 非 确定 线性 空间 内 运行 ， 于 是 根据 萨 维 奇 定 理 ， 可 以 得 到 判定 该 问题 的 确 
定型 OC?) 空间 算法 。 下 面 用 该 算法 的 确定 形式 设计 判定 EQrEx+ 的 算法 E. 
E=“ WA (Ri R2), HP Ri A Re 是 带 指数 的 正则 表达 式 : 
1. 把 Ri Al Ro 转化 为 等 价 的 正则 表达 式 Bi 和 Bo, HFP B 和 Bo 利用 重复 代替 指数 。 
2. 利用 引 理 1. 29 的 证 明 中 给 出 的 转化 过 程 ， 把 Bl 和 Bs 转化 为 等 价 的 NFA N Al No. 
3. 利用 算法 N 的 确定 版 来 判定 NIA Ne 是 否 等 价 。” 

显然 算法 是 正确 的 。 为 了 分 析 它 的 空间 复杂 性 ， 注 意 到 用 重复 替换 指数 的 方法 可 能 
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会 把 表达 式 的 长 度 增加 2 倍 ， 其 中 2 是 指数 的 长 度 和 。 于 是 表达 式 BIM B: 的 长 度 最 大 为 
n2*， 其 中 是 输入 的 长 度 。 引 理 1. 29 的 转化 过 程 使 长 度 线性 增加 ， 因 此 NFA Ni 和 N2 
最 多 有 Oln?) 个 状态 。 因 为 输入 长 度 是 O(z2")， 所 以 算法 N 的 确定 版 消耗 空间 
O((n2")?) =O(n? 22"), FH EQrEx+ 是 指数 空间 可 判定 的 。 

下 面 证 明 EQrexs 是 EXPSPACE 难 的 。 设 图 灵机 M 在 空间 2° 内 判定 语言 A， 其 中 
k 是 某 个 常数 。 归 约 把 输入 w 映射 为 一 对 正则 表达 式 R1 和 R. KEA Ri ME A, BA 
rQ 表示 M 的 带子 字母 表 和 状态 集 ， 则 和 A 二 TUQU{#) 是 计算 历史 中 可 能 出 现 的 所 有 
符号 组 成 的 字母 表 。 构 造 表达 式 R, ， 使 它 产 生 不 代表 M 在 w 上 的 拒绝 计算 历史 的 所 有 字 
FP., A, MÉZ w 当 且 仅 当 M 在 w 上 没有 拒绝 计算 历史 。 因 此 这 两 个 表达 式 等 价 当 
AM4 M 接受 w。 构 造 过 程 如 下 。 

M 在 双 上 的 一 个 拒绝 计算 历史 是 由 符号 # 分 隅 的 一 系列 格局 。 采 用 标准 的 格局 编码 ， 
其 中 代表 当前 状态 的 符号 放 在 当前 读 写 头 位 置 的 左边 。 假 定 所 有 格局 的 长 度 为 2") ， 如 果 
长 度 不 够 ， 就 用 空 日 符 填 在 右边 。 拒 绝 计 算 历 史 的 第 一 个 格局 是 M E w 上 的 初始 格局 ， 
最 末 格 局 是 一 个 拒绝 格局 。 每 一 个 格局 都 必须 根据 转移 田 数 中 指定 的 规则 从 前 一 个 格局 转 
变 而 来 。 

一 个 字符 串 不 代表 拒绝 计算 的 情况 可 能 有 几 种 。 或 者 它 非 正 党 开始 ， 或 者 非 正 常 结 
束 ， 或 者 在 中 间 某 处 不 正确 。 表 达 式 Ro 等 于 Rbag_ start U Road- window U Road- reject » FE P EA 
子 表 达 式 对 应 于 字符 串 不 代表 拒绝 计算 的 上 面 三 种 情况 之 一 。 

现在 构造 表达 式 Rbad- star ， 使 它 产生 所 有 不 以 M 在 w 上 的 起 始 格 局 Cl 开头 的 字符 
串 。 格 局 Ci Ba qow wewn UU UF, AME Ci 的 每 一 部 分 ， 把 Rbaq- start 写 成 几 个 子 
表达 式 的 并 : 

Rbad- start = So U Si U = US, U S U Sa 

表达 式 So 产生 所 有 不 以 go 开头 的 字符 串 。 令 S 是 表达 式 A-g,A* 。 Wie A-q, A 
中 除去 go 以 后 ， 所 有 符号 的 并 的 简写 。 

表达 式 S; 产生 所 有 第 二 个 位 置 上 不 是 wi WER. SS) 是 AA_。A* 。 一 般 地 讲 ， 
对 于 lin, RAA S; 是 AiA-w A* 。 于 是 S 产生 所 有 这 样 的 字符 串 ， 它 们 在 前 i 个 位 
置 上 包含 任何 字符 ， 在 位 置 i 十 1 上 包含 除 w 以 外 的 任何 字符 ， 在 位 置 i 十 1 以 后 包含 任意 
字符 串 。 注 意 ， 这 里 已 经 使 用 了 指数 运算 。 实 际 上 ， 在 这 时 候 指 数 运算 只 是 为 了 方便 ， 而 
不 是 必需 的 ， 因 为 本 来 可 以 把 符号 A 重复 i 次 ， 而 不 会 过 度 地 增加 表达 式 的 长 度 。 但 是 在 
下 面 的 子 表 达 式 中 ， 指 数 运算 对 于 把 长 度 保持 在 多 项 式 内 就 起 决定 性 作用 了 。 

表达 式 Se 产生 所 有 在 ”十 2 到 2 ) 的 某 个 位 置 上 不 包含 空白 符 的 字符 串 。 为 此 本 来 可 
以 引进 子 表达 式 S 直到 Soo ， 但 是 那样 做 将 会 使 表达 式 Rbaa-star 的 长 度 为 指数 。 改 令 

S = ArH (A U e)? A A 
于 是 So 产生 的 字符 串 在 前 2 十 1 个 位 置 包含 任何 字符 ， 在 接 下 来 的 上 个 位 置 也 包含 任何 字 
符 ， 其 中 上 也 可 以 从 0 到 2° ) 一 z" 一 2， 再 下 一 个 位 置 包含 除 空白 符 以 外 的 任何 字符 。 
最 后 ，S# 产生 所 有 在 位 置 2 十 1 上 不 包含 符号 # 的 字符 串 。 令 S# 是 A?” A-# A* 。 


前 边 已 经 完成 了 Rbad- start 的 构造 ， 现在 开始 下 一 部 分 各 bad reject s 它 产 生 所 有 非 正 常 结 
束 的 字符 串 ， 即 不 包含 拒绝 格局 的 字符 串 。 任 何 拒绝 格局 都 包含 状态 qee ， 所 以 令 
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Rbad- reject = A*a jea 
于 是 Road- reject ÆW A DE reject FFR., 
最 后 构造 表达 式 Road-window， 使 它 产 生 所 有 这 样 的 字符 串 : 其 中 的 一 个 格局 不 能 正确 
地 转变 为 下 一 个 格局 。 回 忆 一 下 ， 在 库 克 - 列 文 定 理 的 证 明 中 ， 只 要 第 一 个 格局 的 每 三 个 
连续 符号 都 能 根据 转移 孔 数 正确 地 产生 第 二 个 格局 的 相应 的 三 个 符号 ， 就 判定 第 一 个 格局 
合法 地 产生 第 二 个 格局 。 所 以 ， 如 果 一 个 格局 不 能 产生 男 一 个 格局 ， 通 过 考察 适当 的 六 个 
符号 就 能 使 错误 显现 出 来 。 采 用 这 种 思想 来 构造 Rbaq- window : 


Rbad- window 一 U A* abc Ae 2) def A á 
bad(abc ,de 万 ) 


其 中 bad(abc,def) 的 意思 是 根据 转移 函数 abc 不 能 生成 def, HIZB ABM A 中 这 样 的 
F5 a,b,c,d e, f ETH. K 9-1 显示 了 在 一 个 计算 历史 中 这 些 符号 的 位 置 。 


g c 


i+1 


es ———— 
|#| -~ Jaļjbje| … [#] ~ ladlelf| -~~ |#| 3 


20_2 


图 9-1 相 邻 格局 的 对 应 位 置 


为 了 计算 R 的 长 度 ， 确 定 出 现在 其 中 的 指数 的 长 度 。 其 中 出 现 了 几 个 量 级 大 约 为 
20) 的 指数 ， 它 们 的 二 进 制 总 长 为 OCO) 。 因 此 R 的 长 度 是 的 多 项 式 ，。 m 


9.2 相对 化 


EQrex 4 难 解 性 的 证 明 依赖 于 对 角 化 法 。 为 什么 不 用 同样 的 方法 证 明 SAT 是 难 解 的 
呢 ? 或 许 ， 可 以 用 对 角 化 法 证 明 一 个 非 确定 型 多 项 式 时 间 图 灵机 能 够 判定 一 个 不 在 了 中 的 
语言 。 本 节 介 绍 相 对 化 (relativization) 方法 ， 它 给 出 有 力 的 证 据 排 除了 用 对 角 化 法 解决 
P 与 NP 问题 的 可 能 性 。 

在 相对 化 方法 中 ， 将 修改 计算 模型 ， 给 图 灵机 一 些 本 质 上 是 “免费 ”的 信息 。 依 据 实 
际 提供 给 它 的 信息 ， 图 灵机 就 可 能 比 以 前 更 轻松 地 解决 某 些 问题 。 

例如 ， 假 定 对 任何 长 度 的 布尔 公式 ， 给 图 灵机 以 在 一 步 内 解决 可 满足 性 问题 的 能 力 。 
个 附带 的 “黑匣子 ”给 了 机 需 这 种 能 力 。 可 以 把 这 个 黑 
匣子 称 为 论 示 ， 以 强调 它 没 必要 对 应 于 任何 物理 设备 。 显 然 ， 不 管 己 是 否 等 于 NP， 机 器 
都 可 以 利用 论 示 在 多 项 式 时 间 内 解决 任何 NP 问题 ， 因 为 每 一 个 NP 问题 都 可 多 项 式 时 间 
归 约 到 可 满足 性 问题 。 这 样 的 图 灵机 被 称 为 相对 于 可 满足 性 问题 进行 计算 ， 因此 才 有 术语 
相对 化 。 

一 般 地 讲 ， 论 示 可 以 对 应 于 任何 具体 的 语言 ， 不 仅仅 是 可 满足 性 问题 。 论 示人 允许 图 灵 
机 判定 该 语言 的 成 员 资格 ， 而 不 必 目 己 计 算出 答案 。 下 面 把 这 个 概念 简略 地 形式 化 。 读 者 
可 能 会 回忆 起 在 6. 3 节 曾 经 碰 到 过 论 示 。 那 时 ， 和 定义 它 是 为 了 根据 不 可 解 度 来 给 问题 分 
类 。 这 里 ， 利 用 论 示 是 为 了 更 好 地 理解 对 角 化 方法 的 能 力 。 

(ER 有史 针对 一 个 语言 A 的 论 示 是 一 个 能 够 判断 任何 串 ww 是 否 在 该 语言 中 的 设 
g. MARA RB Coracle Turing machine) M4 就 是 在 通 第 的 图 灵机 基础 上 增加 查询 A 的 论 
示 的 能 力 。 每 当 M ERAMA Coracle tape) 的 特殊 带子 上 写 下 一 个 字符 串 时 ， 它 就 
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能 在 一 步 内 计算 得 知 这 个 字符 串 是 否 属 于 A。 

令 P4 是 采用 论 示 A 的 多 项 式 时 间 论 示 图 灵机 可 判定 的 语言 类 。 类 似 地 可 以 定义 
NP“. 

如 前 面 提 到 的 ， 相 对 于 可 满足 性 问题 的 多 项 式 时 间 计 算 包含 了 NP 的 全 部 。 
换言之 ，NPGPs4AT 。 进 一 步 ，coNPGCPs4AT ， 因 为 PAT 是 一 个 确定 型 复杂 性 类 ， 在 补 运算 
下 封闭 。 & 

正如 PAT 包含 不 属于 了 的 语言 一 样 。NPs4T 包含 不 属于 NP 的 语言 。 问 
题 7. 21 中 定义 的 语言 MIN FORMULA 的 补 集 给 出 了 这 样 的 一 个 例子 。 

MIN- FORMULA 似 乎 不 在 NP 中 (虽然 它 是 否 属 于 NP 还 不 知道 )。 然 而 ， 
MIN- FORMULA 属 于 NPT, WALI SAT 为 论 示 的 非 确 定型 多 项 式 时 间 论 示 图 灵机 可 
以 如 下 检查 y 是 否 属 于 它 。 首 先 ， 因 为 非 确定 型 机 器 可 以 猜测 使 两 个 布尔 公式 的 值 不 相同 
的 赋值 ， 所 以 两 个 布尔 公式 的 不 等 价 问题 是 NP 内 可 解 的 ， 从 而 等 价 问题 属于 coNP。 然 
后 ， 判 定 MIN FORMULA 的 非 确 定型 论 示 机 器 非 确定 地 猜测 一 个 更 小 的 等 价 公 式 ， 用 论 
示 SAT 来 检查 它 是 否 真 的 是 等 价 的 ， 若 是 ， 则 接受 。 m 


对 角 化 方法 的 局 限 


下 一 个 定理 表明 存在 论 示 A 和 B， 使 得 可 以 证 明 PAS NP4 不 同 ， 而 P83 与 NPE +m. 
这 两 个 论 示 很 重要 ， 因 为 它们 的 存在 表明 不 太 可 能 用 对 角 化 方法 解决 了 与 NP 问题 。 

对 角 化 方法 的 核心 是 一 台 图 灵机 对 另 一 台 图 灵机 的 模拟 。 模 拟 是 这 样 完成 的 : 模拟 机 
器 能 够 确定 另 一 台 机 器 的 行为 ， 从 而 以 不 同 的 方式 动作 。 假 定 给 这 两 台 机 器 以 同样 的 论 
示 ， 那 么 每 当 被 模拟 机 器 询问 论 示 时 ， 模 拟 机 也 询问 ， 所 以 模拟 过 程 可 以 像 以 前 一 样 进行 
下 去 。 因 此 ， 凡 是 仅 用 对 角 化 方法 证 明 的 关于 图 灵机 的 定理 ， 当 给 两 台 机 器 以 相同 论 示 的 
时 候 ， 将 仍然 成 立 。 

特别 地 讲 ， 如 果 能 用 对 角 化 方法 证 明了 P 与 NP 不 同 ， 就 能 下 结论 说 它们 相对 于 任何 论 
示 也 是 不 同 的 。 但 是 PP NP3 相 等 ， 所 以 结论 不 成 立 。 因 此 对 角 化 方法 不 足以 分 开 这 两 
个 类 。 类 似 地 ， 依 据 简 单 模拟 的 证 明 不 能 说 明 这 两 个 类 相等 ， 因 为 那 将 证 明 它 们 相对 于 任 
何 论 示 都 是 相等 的 ， 但 实际 上 PAR NPA AAS. 

Erp 

1. 存在 论 示 A 使 得 PAANPS, 

2. 存在 论 示 B444 PE 二 NP8 。 

证 明 思 路 ”展示 论 示 B 是 容易 的 ， 只 需 令 B 是 任意 的 PSPACE 完全 问题 (如 TQBF) 
即 可 。 

构造 论 示 A。 设 计 A 使 得 NP4 中 的 某 个 语言 工 A 在 证 明 它 时 需要 蛮 力 搜索 ， 因 而 La 不 
可 能 属于 P4 。 因 此 可 以 得 出 P4 夭 NP4 的 结论 。 构 造 过 程 依次 考察 每 一 个 多 项 式 时 间 论 示 
机 器， 保证 每 一 个 都 不 能 判定 语言 La。 

证 明 令 B 是 TQBF。 有 下 面 一 系列 包含 关系 : 


1 2 3 
NP" c&C NPSPACE © PSPACE C Po 


包含 关系 1 成 立 ， 因 为 可 以 把 非 确定 型 多 项 式 时 间 论 示 机 器 转变 为 非 确定 型 多 项 式 空间 
机 器 ， 该 机 器 不 使 用 论 示 ， 而 是 计算 出 对 TQBF 的 查询 的 答案 。 由 萨 维 奇 定 理 可 知 包含 关系 
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2 成 立 。 包 含 关 系 3 成 立 是 因为 TQBF 是 PSPACE 完全 的 。 因 此 下 结论 PEF = Np , 

下 面 说 明 怎 样 构造 论 示 A。 对 于 任意 的 论 示 A， 令 工 4 是 所 有 这 样 的 字符 串 的 集合 : A 
中 有 一 个 长 度 相 同 的 字符 串 。 于 是 

La = {w| 3z E€ AL| xz ]=| w {J} 
显然 ， 对 于 任何 A， 语 言 LA 属于 NPA, 

为 了 证 明 La Aa P4， 如 下 设计 A。 设 Mi ,Mz,…， 是 所 有 多 项 式 时 间 论 示 图 灵机 
的 列表 。 为 了 简单 ， 假 定 M; 在 时 间 ni 内 运行 。 构 造 过 程 分 步骤 进行 。 第 i 步 构 造 A 的 一 
部 分 ， 保 证 MA 不 判定 La。 通 过 声明 某 些 字符 串 在 A 中 而 另外 一 些 字 符 串 不 在 A 中 来 构 
造 A。 每 一 步 仅 确定 有 穷 个 字符 串 的 状态 〈 指 在 或 者 不 在 A 中 )。 开 始 ， 没 有 关于 A 的 任 
何 信息 。 从 步骤 1 开始 。 

步骤 i 迄今 为 止 ， 已 经 声明 有 穷 个 字符 串 在 或 不 在 A 中。 选择 n， 让 它 比 所 有 这 些 
串 的 长 度 都 长 ， 而 且 n 充分 大 使 得 2”* Hn K, 天 是 Mi 的 运行 时 间 。 现 在 说 明 怎 样 扩展 
关于 A 的 信息 ， 使 得 只 要 1"” RELA, MAREE. 

在 输入 1” 上 运行 Mij， 如 下 回应 它 的 论 示 查询 。 如 果 Mi; 查询 一 个 状态 已 经 确定 的 字 
符 串 >， 回应 与 它 的 状态 一 致 。 如 果 y 的 状态 还 未 确定 ， 就 对 查询 返回 NO， 并 声明 y 不 
在 A 中 。 继 续 模拟 Mi; ， 直 到 它 停 机 。 

现在 从 M: 的 角度 考虑 问题 。 如 果 M 发 现 一 个 长 为 n 的 字符 串 在 A 中 ， 它 就 应 该 接 
受 ， 因 为 它 知道 1 在 La 中 。 如 果 M: 确定 所 有 长 为 n 的 字符 串 都 不 在 A 中 ， 它 就 应 该 拒 
绝 ， 因 为 它 知道 1 不 在 La 中 。 但 是 ， 它 没有 足够 的 时 间 来 询问 所 有 长 为 n 的 字符 串 ， 而 
且 我 们 已 经 对 它 所 做 的 每 一 个 查询 都 回答 NO。 所 以 当 M; 停机 时 必须 决定 是 接受 还 是 拒 
绝 ， 而 它 还 没有 足够 的 信息 保证 它 的 决定 是 对 的 。 

现在 的 目标 是 确保 它 的 决定 是 不 对 的 。 为 此 ， 观 察 它 的 决定 ， 然 后 扩展 A 使 其 反面 成 
Ww. TH, WR M: 接受 1" ， 就 声明 所 有 剩 下 的 长 为 的 字符 串 都 不 在 A 中 ， 从 而 确定 1” 
不 属于 Las WẸ Mi; 拒绝 1"， 就 可 以 找到 一 个 M: 尚未 查询 过 的 长 为 n 的 字符 串 ， 并 声明 
该 字符 串 属 于 A， 从 而 保证 1* 属于 Ls。 这样 的 字符 串 必定 存在 ， 因 为 M: 运行 ni 步 ， 少 
于 长 为 n 的 字符 串 总 数 2*。 任 何 情况 都 能 确定 M;^ 不 判定 La。 

步骤 i 把 那些 状态 还 没有 确定 下 来 且 长 度 不 超过 nn 的 字符 串 都 声明 为 不 在 A 中 ， 该 步 
完成 。 从 步骤 ;十 1 继续 进行 下 去 。 

已 经 证 明 没 有 多 项 式 时 间 论 示 图 灵机 能 够 以 论 示 A 判定 La， 因 此 定理 得 证 。 s 

总 之 ， 相 对 化 方法 表明 : 为 了 解决 P 与 NP 问题 ， 必 须 分 析 计 算 ， 而 不 仅仅 是 模拟 它 
们 。 在 9.3 节 中 ， 将 介绍 一 种 可 能 会 导向 这 种 分 析 的 方法 。 


9.3 电路 复杂 性 


将 按照 数字 电路 设计 的 电子 吏 件 用 导线 连 在 一 起 ， 就 构成 了 计算 机 。 也 可 以 用 对 应 数 
字 电 路 的 理论 模型 〈 称 为 布尔 电路 ) 来 模拟 如 图 灵机 这 样 的 理论 模型 。 建 立 图 灵机 与 布尔 
电路 之 间 的 联系 有 两 个 目的 。 第 一 ， 研 究 者 相信 电路 提供 了 一 种 方便 的 计算 模型 ， 用 以 处 
理 P 与 NP 问题 及 其 相关 问题 。 第 二 ， 电 路 为 有 关 SAT 是 NP 完全 的 库 克 - 列 文 定理 提 
供 了 男 一 种 证 明 方 法 。 本 市 讨论 这 两 个 主题 ，。 

一 个 布尔 电路 (boolean circuit) 是 由 导线 (wire) 连接 的 门 (gate) 和 


RIF H B 性 239 


输入 (input) 的 集合 ， 其 中 不 允许 出 现 循环 。 门 有 三 种 形式 : SN, KRM FEN, 4 
图 9-2 所 示 。 

布尔 电路 中 导线 传递 布尔 值 0 和 1。 门 是 计算 布尔 函数 AND, OR 和 NOT 的 处 理 器 。 
当 两 个 输入 都 是 1 时 ，AND 函数 输出 1， 和 否则 输出 0。 当 两 个 输入 都 是 0 时 ，OR 函数 输 
出 0， 否则 输出 1。NOT 函数 输出 其 输入 的 反面 ， 换 言 之 ， 若 输入 是 0， 它 输出 1， 若 输 
和 人 是 1， 它 输出 0。 输入 被 标记 为 x1，… ,zx。。 其 中 一 个 门 被 指定 为 输出 门 (output gate). 
图 9- 3 摘 绘 了 一 个 布尔 电路 。 


输入 
? 
输出 
与 或 非 


mes =g” TI. WR” TA MAP” G 图 9-3 布尔 电路 的 例子 


输入 变量 x, x x, 





RE iy 

PRIRA 

it fit 
Hion, W 


输出 门 


布尔 电路 从 输入 的 赋值 中 计算 输出 值 。 它 沿 着 导线 传播 值 ， 计 算 与 相应 的 门 关联 的 函 
数 ， 直 到 输出 门 被 赋予 一 个 值 。 图 9- 4 显示 了 布尔 电路 从 输入 的 赋值 中 计算 出 值 的 过 程 。 

用 函数 来 描述 布尔 电路 的 输入 /输出 行为 。 给 带 n 个 输入 变量 的 布尔 电路 C 关联 一 个 
PRA fo:{0,1}">{0,1}, RH, HA zi1，… ,za 设置 为 a1，…,an 时 ， 若 C 的 输出 为 6， 
WE fc(a1,…,an) 二 56。 称 C 计 算 函 数 fc。 有 时 考虑 有 多 个 输出 门 的 布尔 电路 。 带 个 输 
出 位 的 函数 计算 一 个 值 域 为 {0,1)* 的 函数 。 

URRA) n AATA A (parity function) parity,:{0,1}"~>{0,1} iH 1, 4H 
仅 当 输入 变量 中 有 奇数 个 1。 图 9- 5 的 电路 计算 有 4 个 变量 的 奇偶 函数 parity, 。 a 





1 输出 
图 9-4 布尔 电路 计算 的 例子 图 9-5 计算 4 个 变量 的 奇偶 函数 的 布尔 电路 


实际 上 ， 可 以 用 电路 来 检查 适当 地 编码 为 (0,1}》 上 的 语言 的 成 员 资 格 。 存 在 的 问题 
是 ， 任 何 具体 的 电路 只 能 处 理 某 一 固定 长 度 的 输入 ， 而 语言 可 能 包含 不 同 长 度 的 字符 串 。 
所 以 ， 不 是 用 单一 电路 来 检查 语言 的 成 员 资 格 ， 而 是 用 整个 一 族 电 路 来 完成 这 一 任务 ， 每 
个 输入 长 度 有 一 个 电路 。 在 下 面 的 定义 中 形式 化 这 一 概念 。 
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一 个 电路 族 (circuit family) C 是 电路 的 一 个 无 穷 列 表 (Co ,Cl，C2z ，…)， 
HPC, An ARARE., CE (0,1) 上 判定 语言 A， 如 果 对 于 每 个 字符 串 wl(wEA) 
当 且 仅 当 C,(w) 二 1]， 其 中 nn 是 ww 的 长 度 。 

电路 的 规模 (size) 是 它 所 包含 的 门 的 数目 。 当 两 个 电路 有 同样 的 输入 变量 ， 并 且 在 
每 一 输入 赋值 上 都 输出 同样 值 的 时 候 ， 称 它们 是 等 价 的 。 如 果 一 个 电路 没有 与 之 等 价 的 更 
小 的 电路 ， 则 它 是 (规模 ) 极 小 的 《size minimal) 。 极 小 化 电路 问题 在 工程 上 有 明显 的 应 
用 ， 但 是 一 般 难 以 解决 。 甚 至 判定 一 个 具体 的 电路 是 否 是 极 小 的 这 个 问题 也 不 见得 是 在 了 
或 NP 内 可 解 的 。 一 个 电路 族 中 的 每 一 个 电路 Ci 如 果 是 极 小 的 ， 则 称 该 族 是 极 小 的 。 一 
个 电路 族 (Co ,Cl ,Cz ,…) 的 规模 复杂 度 (size complexity) 是 一 个 图 数 f:N-N, Ht 
f(r) #C, 的 规模 。 当 明显 在 讨论 规模 时 ， 用 电路 族 的 复杂 度 指 代 其 规模 复杂 度 。 

电路 的 深度 (depth) 是 从 输入 变量 到 输出 门 的 最 长 路 径 的 长 度 〈 导 线 的 数目 )。 如 同 
定义 电路 的 规模 一 样 ， 可 以 定义 深度 极 小 〈depth minimal) 的 电路 和 电路 族 以 及 电路 族 的 
深度 复杂 度 (depth complexity)。 在 关于 并 行 计算 的 10.5 节 中 ， 电 路 的 深度 复杂 度 尤 为 
重要 。 

语言 的 电路 复杂 度 (circuit complexity) 是 该 语言 的 极 小 电路 族 的 规模 
复杂 度 。 语 言 的 电路 深度 复杂 度 (circuit depth complexity) 类 似 定 义 ， 只 是 把 规模 换 成 
深度 。 | 

GEEZ 容易 推广 例 9. 21， 给 出 计算 ”个 变量 的 奇偶 函数 的 有 O(z) 个 门 的 电路 。 
一 种 办 法 是 构造 一 棵 由 计算 KOR 孔 数 的 门 组 成 的 二 叉 树 ， 这 里 XOR 函数 就 是 2- 输入 奇 
偶 函 数 (paritys)， 然 后 如 前 面 的 例子 那样 ， 用 2 个 NOT、2 个 AND 和 1 个 OR 实现 每 
个 XOR 门 。 

令 A 是 包含 奇数 个 1 的 字符 串 组 成 的 语言 ， 那 么 A 的 电路 复杂 度 是 O(n)。 z 

语言 的 电路 复杂 度 与 它 的 时 间 复 杂 度 有 关 。 任 何 时 间 复 杂 度 小 的 语言 其 电路 复杂 度 也 
小 ， 如 下 面 的 定理 所 述 。 

设 t:N>N -A BK, t(n)Sn, # AC TIME(t(n)), WMA 的 电路 复 
杂 度 为 O(f2 (n)). 

该 定理 提供 了 一 条 证 明 P 关 NP 的 途径 ， 以 此 证 明 NP 中 的 某 个 语言 的 电路 复杂 度 超 
过 多 项 式 。 

证 明 思 路 i M 是 在 时 间 t(n) 内 判定 A 的 图 灵机 。( 为 了 简单 ， 忽 略 M 的 实际 运行 
时 间 O(¢(n)) 中 的 常数 因子 。， 对 每 一 个 n， 构 造 电 路 C, 模拟 M 在 长 为 n 的 输入 上 的 运 
算 。C 的 门 分 成 行 ， 每 一 行 对 应 M 在 长 为 n 的 输入 上 进行 运算 的 :+(n) 步 之 一 。 门 的 每 一 
行 代 表 M 在 相应 步骤 上 的 格局 〈 状 态 、 读 写 头 位 置 、 带 子 内 容 ) 。 每 一 行 用 导线 连 到 上 一 
行 ， 以 使 它 从 上 一 行 的 格局 能 够 计算 本 格局 。 修 改 M 使 得 输入 编码 为 {0,1}. Bb, 4 
M 即将 接受 时 ， 它 把 读 写 头 移 到 最 左 单元 ， 在 进入 接受 状态 之 前 先 在 那里 写 下 符号 U。 这 
样 一 来 ， 就 可 以 指定 电路 的 最 后 一 行 的 一 个 门 为 输出 门 。 

证 明 设 M==(Q,5, 厂 ,6,qo ,qaccept，4reject) 在 时 间 t(n) 内 判定 A， 设 也是 长 为 ”的 输 
A. 定义 M 在 w 上 的 画面 为 一 张 :(n) Xt) 的 表格 ， 其 行 是 M 的 格局 。 画 面 的 顶 行 包 
含 M 在 w 上 的 起 始 格 局 。 第 i 行 包 含 计 算 历 史 的 第 i 步 的 格局 。 

为 了 方便 ， 本 证 明 修 改 了 格局 的 表示 形式 。 在 3. 1. 1 节 描 述 的 旧 的 形式 中 ， 状 态 出 现 
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在 读 写 头 正在 读 取 的 符号 的 左边 。 与 之 不 同 ， 现 在 把 状态 和 读 写 头 下 的 符号 表示 为 一 个 单 
一 的 复合 字符 。 例 如 ， 若 M 在 状态 4， 带 子 上 包含 字符 串 1011 ， 读 写 头 正 读 取 左 起 第 二 个 
符号 ， 旧 形式 为 19011， 新 形式 为 1 |g0| 11， 其 中 复合 字符 |e0| 同时 表示 状态 g 和 读 写 头 下 
的 符号 0。 

画面 的 每 一 格 可 以 包含 一 个 带子 符号 (TT 的 成 员 ) 或 状态 和 带子 符号 的 组 合 QXT 
的 成 员 ) 。 称 画面 的 第 ; 行 、 第 7 列 的 那 一 格 为 celiLi,jj]。 夯 面 的 顶 行 是 cell[L1,1],…， 
cellL1,t(n)]， 该 行 包含 起 始 格 局 。 

在 定义 画面 的 概念 中 ， 关 于 M 做 了 两 个 假设 。 第 一 ， 正 如 证 明 思路 中 所 讲 的 ， 仅 当 
读 写 头 在 最 左 带子 单元 上 并 且 该 单元 包含 符号 LU 时 ，M 才 接 受 。 第 二 , 一旦 M 停机 ， 它 就 
永远 待 在 同一 格局 中 。 所 以 ， 通 过 查看 画面 最 末 一 行 的 最 左 单元 cell[1(n) ,1]， 就 能 确定 
M 是 否 已 经 接受 。 图 9- 6 显示 了 M 在 输入 0010 上 的 部 分 画面 。 


【 E t(n) 


cellf1,1] MOL 1 fof efufufal = [u 起 始 格 局 
a ae 





cell[t(n),1] 
(接受 位 置 ) 


第 t(n) 个 格局 


图 9-6 M 在 输入 0010 上 的 画面 


每 一 单元 的 内 容 都 由 上 一 行 的 某 些 单元 来 决定 。 如 果 知 道 了 cell[i 一 1 ,j 一 1j、 
cellLi—1,j |Ml cellLi—1,j+1] 的 值 ， 就 能 根据 M 的 转移 函数 获得 cell[Li,jj」 的 值 。 例 如 ， 
下 图 放大 了 图 9-6 的 画面 的 一 部 分 。 上 一 行 的 三 个 符号 0、0 和 1 是 不 含 状态 的 带子 符号 ， 
所 以 中 间 符 号 在 下 一 行 必须 保持 为 0， 如 下 图 所 示 。 


现在 开始 构造 电路 C,。 对 应 画面 的 每 一 个 单元 有 多 个 门 ， 这 些 门 从 影响 某 一 单元 的 
男 外 三 个 单元 的 值 中 计算 出 该 单元 的 值 。 

为 了 使 构造 更 容易 描述 ， 添 加 一 些 灯 来 表示 电路 中 某 些 门 的 输出 。 灯 只 是 用 作 说 明 ， 
不 影响 电路 的 操作 ，。 

设 k 是 TU(TXQ) 中 元 素 的 数目 。 对 于 画面 的 每 一 个 单元 有 上 & BIT. NBT MA 
HRN, TXA 的 每 个 成 员 对 应 一 荔 灯 ， 总 共 ke Cn) BEAT. RAWH light[i,j,sj， 
其 中 1<&i,j 志 (i(n),sETU (TXQ)。 在 一 个 单元 中 的 灯 的 状况 表明 了 该 单元 的 内 容 ; 如 果 
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lightli,j,s) FÆ, cellli j] 就 包含 符号 s。 当 然 ， 如 果 电 路 构造 正确 ， 一 个 单元 中 只 能 
有 一 草 灯 开 着 。 

KARTERA, BERE cellli,j] 中 的 light[Li,j,s]。 如 果 该 单元 包含 符号 s, 
BIW A. SIR celli j] 的 三 个 单元 ， 确 定 哪 些 赋值 会 使 cell[i,jj]」 BE s. 
通过 考察 转移 函数 $， 就 可 以 做 此 决定 。 

假定 ， 按 照 $S， 当 单元 cellli—1,j—1], cellli—1,j], cellli—l,j +1] 分 别 包含 a， 
b,c 时 ，cell[i,;j」 包含 s。 用 导线 连接 电路 ， 使 得 如 果 lightlLi—1,j—l,a], lightli—1,j, 
b] MlightlLi-1,j+l.c] MAA, Wiightli,j,s|] ERE. HEE ;一 1 行 的 这 三 营 灯 连 
到 与 门 ， 其 输出 连 到 lightli,j,s]. 

— fH, cellli—1,j—1], cell[i—1,j], cell[i—1,j+1] 有 几 个 不 同 的 赋值 (a, 
biyc1),《az ,Bb2 sc2),"…,《ai,bi,c1) 都 可 以 使 cell isj] 包含 sS。 在 这 种 情况 下 ， 用 导线 连接 
电路 ， 使 得 对 应 每 一 组 赋值 a; ,6b; ,c;， 各 自 的 灯 都 连 到 与 门 ， 所 有 与 门 都 连 到 或 门 。 这 个 
电路 如 图 9-7 所 示 。 

刚才 描述 的 电路 对 每 人 荔 灯 都 一 样 ， 只 是 
在 边界 上 有 几 处 例外 。 画 面 的 左边 界 上 的 每 
ME BI celli lle 1<i<t(n), RAE 
一 行 的 两 个 单元 可 能 影响 它 的 内 容 。 在 右边 
界 上 的 单元 也 是 一 样 。 在 这 种 情况 下 ， 修 改 
电路 ， 让 它 模拟 M 在 这 种 情况 下 的 行为 。 

第 一 行 的 单元 都 没有 前 驱 ， 需 要 用 一 种 
特殊 方式 处 理 它 们 。 这 些 单 元 包含 起 始 格 
局 ， 它 们 的 灯 用 导线 连 到 输入 变量 。 于 是 
light(1,1,|go1]] 连 到 输入 ww ， 因 为 起 始 格 
局 以 起 始 状态 符 d0 开始 ， 读 写 头 在 w 上 起 
动 。 类 似 地 ，Llight[1,1,|go0|] 通过 非 门 连 到 输入 wy 。 进 一 步 ，lighi[1,2,1],…, light[1,n， 
1] 连 到 输入 wz ,… ,wn M light[1,2,0],… ,lightL1,n,0」 通 过 非 门 连 到 输入 wz ，… ,wn， 
因为 输入 字符 串 w 决定 了 这 些 值 。 另 外 ，Llight[1,n 十 1,U],…,light[1,t(n),U] 都 开 着 ， 
因为 第 一 行 中 剩余 的 单元 对 应 带子 上 初始 为 空格 UO) 的 位 置 。 最 后 ， 第 一 行 中 所 有 其 他 
灯 都 关 着 。 

到 此 为 止 , 已 经 构造 了 一 个 电路 来 模拟 M 的 第 t(n) 步 。 剩 下 要 做 的 就 是 指定 一 个 门 
为 电路 的 输出 门 。 当 MEB) 步 在 带子 左 端 的 一 个 包含 U 的 单元 上 进入 接受 状态 Qacep 
时 ， 它 接受 w。 所 以 指定 输出 门 为 与 light[1(n) ,1,|gseeeptL] 相关 联 的 门 。 这 就 完成 了 本 
定理 的 证 明 。 a 

除了 把 电路 复杂 性 与 时 间 复 杂 性 联系 起 来 以 外 ， 定 理 9. 25 还 给 出 了 定理 7.22 〈 即 库 
克 - 列 文 定 理 ) 的 男 一 种 证 明 ， 如 下 所 述 。 称 布尔 电路 是 可 满足 的 ， 如 果 输 入 的 某 一 赋值 
使 电路 输出 1。 电 路 可 满足 性 (circuit-satisfiability〉 问题 就 是 判定 一 个 电路 是 否 是 可 满足 


的 。 令 





图 9-7 — ZIT W E 


CIRCUIT-SAT = {((C) |C 是 可 满足 的 布尔 电路 } 
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前 面 的 定理 9. 25 说 明 布 尔 电路 能 够 模拟 图 灵机 。 用 这 个 结果 来 证 明 CIRCUIT- SAT 是 
NP 完全 的 ， 

CIRCUIT-SAT 是 NP 完全 的 。 

WEAR 为 了 证 明 该 定理 ， 必 须 证 明 CIRCUIT- SAT 属于 NP， 并 且 NP 中 的 任何 语言 
A 都 可 归 约 到 CIRCUIT-SAT。 第 一 点 是 显然 的 。 为 了 证 明 第 二 点 ， 必 须 给 出 多 项 式 时 间 
归 约 f/， 把 字符 串 映射 为 电路 ， 其 中 

fiuj = (C) 
蕴涵 
w € A SHREK OC 是 可 满足 的 

因为 A 属于 NP， 所 以 它 有 多 项 式 时 间 验 证 机 器 V， 其 输入 的 形式 为 (x,c);， 这 里 c 
可 以 是 证 明 z 属于 A 的 证 书 。 为 了 构造 f， 用 定理 9. 25 的 方法 得 到 模拟 V 的 电路 。 把 w 
的 符号 填 人 对 应 于 z 的 电路 的 输入 。 剩 下 的 电路 输入 都 对 应 证 书 <c。 把 这 个 电路 称 为 C, 

E C 是 可 满足 的 ， 则 存在 一 个 证 书 ， 所 以 也 属 于 A。 反 之 ,在 了 属于 A， 则 存在 一 
个 证 书 。 所 以 C 是 可 满足 的 。 

为 了 证 明 该 归 约 在 多 项 式 时 间 内 运算 ， 必 须 考察 定理 9. 25 的 证 明 ， 注 意 到 电路 的 
构造 可 以 在 nn 的 多 项 式 时 间 内 完成 。 验 证 机 的 运行 时 间 是 过 ， 所 以 构造 的 电路 的 规模 是 
O(n*)。 电 路 的 结构 非常 简单 (实际 上 它 的 重复 度 很 高 );， 所 以 归 约 的 运行 时 间 是 
O(n?) 。 s 

现在 证 明 3SAT 是 NP 完全 的 ， 从 而 完成 库 克 - 列 文 定 理 的 另 一 种 证 明 方 法 。 

3SAT 是 NP 完全 的 。 

证 明 思 路 ”3SAT 在 NP 中 是 显然 的 。 下 边 证 明 所 有 NP 中 的 语言 都 在 多 项 式 时 间 内 
归 约 到 3SAT。 为 此 把 CIRCUIT SAT 在 多 项 式 时 间 内 归 约 到 3SAT。 归 约 把 电路 C 转化 
为 公式 p, HF C 可 满足 当 且 仅 当 y% 可 满足 。 公 式 为 电路 中 的 每 个 变量 和 每 个 门 都 保留 一 
个 变量 。 

在 概念 上 上， 公式 模拟 了 电路 。y 的 满足 赋值 包含 C 的 满足 赋值 ， 它 也 包含 C 在 满足 
赋值 上 的 计算 历史 中 每 一 个 门 的 值 。 实 际 上 ，y 的 满足 赋值 猜测 C 在 满足 赋值 上 的 所 有 
计算 ， 并 且 最 后 $ 的 子 句 检查 计算 的 正确 性 。 另 外 ，#$ 包含 一 个 子 句 来 规定 C 的 输出 
H1, 

证 明 给 出 一 个 从 CIRCUIT- SAT 到 3SAT 的 多 项 式 时 间 归 约 f。 设 C 是 一 个 电路 ， 
包含 输入 zx1，… ,Zz 和 门 g1，…,gm。 归 约 从 C 构造 包含 变量 zx1…,zi1,g1，… ,gm 的 公式 $。 
$ 的 每 一 个 变量 对 应 C 的 一 条 导线 。 变 量 x; 对 应 输入 导线 ， 变 量 g; 对 应 门 输出 的 导线 。 
把 $ 的 变量 标记 为 wl ,… ,witm。 

现在 描述 $ 的 子 句 。 首 先 使 用 蕴涵 直观 地 描述 $ I, PRI (PQ) 转换 成 
(PVQ)。C 中 每 一 个 带 输 入 导线 w; 和 输出 导线 w; 的 非 门 等 价 于 表达 式 

Cw; > wi) A Cw; > W;) 
该 表达 式 转 换 成 两 个 子 句 
(wi V wi) A (wi V w) 
注意 ， 当 且 仅 当 w: Mw; 的 赋值 正确 地 反映 非 门 的 功能 时 ， 这 两 个 子 句 才 同 时 被 满足 。 


244 RAF AFAR 


C 中 每 一 个 融 输 入 w Aw; 以 及 输出 w 的 与 门 等 价 于 表达 式 
(Cw: A wi) > we) A (wi A w) > we) A Cw: A w) > w) A Cw: A w) > we) 
转换 成 四 个 子 句 为 

(wi V wi V we) A (wiV w V we) A (wiV w V we) A Co V w V wed 
C 中 每 一 个 带 输 入 w; Aw; 以 及 输出 w 的 或 门 等 价 于 表达 式 
(Cw; A wi) > wed A (wi A wi) > we) A (wi A w) > wed A Cw; A w) > we) 
转换 成 四 个 子 句 为 

(vw V wy V wed) A Cw V wi V wed) A Ce V w V wed) A G V Ww V we) 

在 这 两 种 情况 下 ， 只 有 当 变 量 w;、w; 和 w 的 赋值 正确 地 反映 了 门 的 功能 时 ， 所 有 
四 个 子 句 才能 被 满足 。 另 外 ， 把 子 句 Cwm) MASP, wn BC 的 输出 门 。 

所 描述 的 某 些 子 句 包含 的 文字 少 于 三 个 。 通 过 重复 文字 就 可 以 把 这 些 子 句 扩 展 到 所 需 
要 的 长 度 。 例 如 ， 将 子 句 (wm) 扩展 为 等 价 的 子 句 (wm V wm V wm)。 这 就 完成 了 构造 。 

下 边 简 要 地 说 明了 该 构造 满足 要 求 。 如 果 存 在 满足 C 的 赋值 ， 那 么 根据 C 在 该 赋值 上 
的 计算 历史 来 给 变量 g; 赋值 ， 就 可 以 得 到 满足 $ 的 赋值 。 反 之 ， 如 果 存 在 满足 $ 的 赋值 ， 
它 就 给 出 了 cC 的 赋值 ， 因 为 它 描述 了 C 的 整个 计算 历史 ， 其 中 输出 值 是 1。 归 约 可 以 在 多 项 
式 时 间 内 完成 ， 因 为 计算 历史 简单 ， 输 出 规模 是 输入 规模 的 多 项 式 (实际 上 是 线性 的 )。 a 


练习 


A9.1 证 明 TIME(2”) 王 TIME(22+1 ) 。 
A9.2 证 明 TIME(2")¢ TIME(22") 。 
Ag9.3 证 明 NTIME(n)G PSPACE。 
9.4 如 在 图 9-4 中 所 做 的 那样 ， 标 出 图 9- 5 所 描绘 的 电路 中 所 有 门 计算 出 的 值 ， 从 而 说 明 它 在 输 
入 0110 上 的 计算 历史 。 
9.5 给 出 三 个 输入 变量 上 计算 奇偶 函数 的 电路 ， 并 说 明 它 在 输入 011 上 的 计算 历史 。 
9.6 证 明 若 AEP， 则 PA=P, 
9.7 给 出 带 指数 的 正则 表达 式 ， 产 生 如 下 在 字母 表 (0,1) 上 的 语言 : 
Aa. 所 有 长 度 为 500 的 字符 串 。 
^b. 所 有 长 度 不 超过 500 的 字符 串 。 
Ac. 所 有 长 度 不 少 于 500 的 字符 串 。 
Ad. 所 有 长 度 不 等 于 500 的 字符 串 。 
e 所 有 恰好 包含 500 个 1 HAR. 
f. 所 有 包含 至 少 500 个 1 的 字符 串 。 
g 所 有 包含 至 多 500 个 1 的 字符 串 。 
h. 所 有 长 度 不 少 于 500 并 且 在 第 500 个 位 置 上 为 一 个 0 的 字符 串 。 
i 所 合 包含 两 个 0 并 且 其 间 至 少 相隔 500 个 符号 的 字符 串 。 
9.8 BREEWRARK, FR RRRAR 
R” U R™+1 U ree U R” 
说 明 怎 样 利 用 通常 的 指数 算 子 实现 算 子 Ri™…" ,但 不 许 用 “…”。 
9.9 证 明 若 NP=P™7, ， 则 NP=coNP. 
9.10 在 问题 8. 29 PR AUER, Ara Æ PSPACE 完全 的 ， 
a. 说 明 ALsA 是 否 属 于 NL 并 给 出 解释 。 
b. 说 明 AlLesA 是 否 属于 了 并 给 出 解释 。 
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9.11 在 问题 7. 19 中 给 出 了 语言 MAX-CLIQUE, 证 明 MAX-CLIQUE€ P™T , 
问题 
9.12 回忆 一 下 ， 指 定 多 个 输出 门 ， 就 可 以 考虑 输出 (0,1) 上 的 字符 串 的 电路 了 。 设 add, :{0,1}"— 
{0,1}*+1 计 算 两 个 位 二 进 制 整 数 的 和 并 输出 nn 十 1 位 结果 。 证 明 可 以 用 O(Cz) 规模 的 电路 计 
A pki BW add, . 
9.13 MPR majorityn:{0,1}">{0,1}#: 
a 0 Da<n/2 
MAjOrit yn (X1 yn) = | Rete 
于 是 majority, 图 数 返回 输入 中 的 多 数 派 。 证 明 majority, 可 以 用 下 面 的 电路 计算 : 
a. O(n?) 规模 的 电路 。 
b. O(nlogn) 规模 的 电路 。( 提 示 : 递归 地 把 输入 数 分 成 两 半 并 利用 问题 9. 12 的 结果 。) 
* 9.14 如 问题 9. 13 一 样 定义 问题 majority, 。 证 明 它 可 以 用 Om) 规模 的 电路 计算 。 
15 假设 A 和 避 是 两 个 论 示 。 现 只 知道 其 中 一 个 是 TQBF 的 论 示 ， 但 不 知道 到 底 是 哪 一 个 。 请 给 
出 一 个 能 访问 A 和 B 的 算法 ， 并 且 该 算法 能 在 多 项 式 时 间 内 解决 TQBF 问题 。 
9.16 证 明 存 在 论 示 C 使 得 NP©AcoNPC 。 
9.17 ”KK -查询 论 示 图 灵机 (k-query oracle Turing machine) 是 在 每 个 输入 上 人 允许 至 多 进行 次 查询 的 
论 示 图 灵机 。 用 符号 MAY Ra tii A Wk AMAA PLM, EX PA'* 为 能 在 多 项 式 时 间 
内 被 M4 判定 的 语言 集合 。 
a. 证 明 NPUcoNPCP™T®! , 
b. 假设 NP+coNP, 证 明 PUcoNPG PS7,1, 
9.18 定义 唯一 满足 (unique-sat) 问题 为 : USAT={(p)| p 是 一 个 只 有 唯一 满足 赋值 的 布尔 公式 )。 
证 明 USAT € Ps47 。 
9.19 $ EREx+ 二 {4《R)|R 是 一 个 具有 指数 形式 的 正则 表达 式 ，L(R) 二 @}， 证 明 Erexs EP. 
9.20 说 明 下 面 的 关于 P 关 NP 的 错误 “证 明 ” 错 在 哪里 。 采 用 反 证 法 。 假 设 P==NP,， M SATEP。 
所 以 ， 对 于 某 个 k，SATE TIME(n*)。 因 为 NP 中 的 每 个 语言 多 项 式 时 间 可 归 约 到 SAT， 所 
以 NPCTIME(m)。 因 此 PCTIME(Cm)。 BÆ, AAEE, TIME nt!) 包含 不 在 
TIME()》 中 的 语言 ， 这 与 PCTIMECn*) 矛盾 。 所 以 PANP. 
9.21 考虑 函数 pad:>* XN>S* #* 定义 如 下 ; 令 pad(s, D=s#!, HP j=max(0,l—m), m Æs 
HKE. TE pad(s, D) REE s 的 末尾 添加 足够 多 的 新 符号 # ， 使 得 结果 的 长 度 至 少 是 1。 对 
于 任何 语言 A 和 函数 f :NN， 定 义 语言 pad(A, 了 ) X: 
pad(A,f) = {pad(s,f(m))|sE A,m 是 s 的 长 度 } 
证 明 ; 4 AC TIME(n®), Mj pad(A,n?) ETIME). 
9.22 WEH: # NEXPTIME4EXPTIME, Wl] P 关 NP。 你 会 发 现 问题 9.21 中 定义 的 函数 pad 对 证 明 
本 问题 是 有 用 的 。 
A9,23 如 问题 9. 21 一 样 定义 pad. 
a. 证 明 : 对 任何 语言 A 和 任何 自然 数 k，AEP 当 且 仅 当 pad(A,n*)EP. 
b. 证 明 PASPACE(n), 
9.24 证 明 TQBFG SPACE(n!/3)。 
“9.25 参考 问题 5. 14 中 关于 2DFA (〈 双 头 有 限 自 动机 ) 的 定义 ， 证 明 在 P 中 存在 一 个 语言 不 能 被 
2DFA 识别 。 
习题 选 解 
91 大 O 记 法 定义 了 时 间 复 杂 性 类 ， 因 此 常量 因子 对 分 类 没有 影响 。 函 数 2" :的 时 间 复 杂 性 是 
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9.3 


9. 23 
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O(2"), 所 以 AETIME(2") 当 上 且 仅 当 AC TIME(2"*!), 

由 于 2"<2?", He TIME(2")CTIME(22") 成 立 。 利 用 时 间 层 次 理论 ， 可 以 证 明 这 个 包含 关系 

是 真 包 含 的 。 函 数 22 是 时 间 可 构造 的 ， 因 为 在 O(2*?”) 时 间 内 ， 一 个 图 灵机 可 以 先 写 一 个 1 

然后 紧 跟 2n 个 0。 因 此 时 间 层 次 理论 确保 存在 这 样 一 个 语言 A， 它 可 以 在 O(22) 内 判定 ， 但 

不 能 在 0( 2?" /log2?") =0(27"/2n) 内 判定 。 所 以 AC TIME(2""), 但 AG TIME(2")。 

因为 任何 图 灵机 在 某 个 计算 分 支 上 运行 耗费 时 间 t(n) 时 ， 它 在 该 分 支 上 使 用 的 单元 格 至 多 为 

t(n) 个 ， 所 以 NTIME(n) 必 NSPACE(n)。 根 据 萨 维 奇 定理 已 知 NSPACE(n)CSPACE(mw)。 根 

据 空 间 层 次 定理 SPACE (nr? )S SPACE(mw)。 由 于 SPACE(m)CPSPACE， 所 以 NTIME(n)G 

PSPACE, 

a. Pal b. (SUs) c. 500 y * d. (SUe)* LJ soo y" 

a CA 是 任何 语言 RON. GAEP, WM pad(A,m)EP， 这 是 因为 通过 以 下 几 个 步骤 可 以 得 
出 这 个 结论 。 第 一 步 ， 通 过 将 w 写成 ;#!/ 的 形式 (其 中 s 不 包含 符号 #) 从 而 判断 wE 
pad(A,m) 是 否 成 立 。 第 二 步 ， 判断 |w| 二 |s|* 是 否 成 立 。 第 三 步 ,判断 ;SE A 是 否 成 立 。 
在 多 项 式 时 间 内 完成 第 一 步 是 显然 的 。 第 二 步 的 运行 时 间 为 |s| 的 多 项 式 ， 因 为 |s| 三 |w|l， 
运行 时 间 为 |w| 的 多 项 式 ， 所 以 第 二 步 在 多 项 式 时 间 内 完成 。 若 pad(A.ntEP, Ii ACP, 
因为 通过 用 # 对 w 进行 填充 直到 其 长 度 为 | w, KETA wEA 是 否 成 立 ， 接 着 判断 它 
是 否 属于 pad(A,n*)。 两 个 步骤 都 仅 需 要 多 项 式 时 间 。 

b. 假设 P 二 SPACE(n)。 令 A 是 一 个 语言 ， 它 属于 SPACE(n’), 但 不 属于 SPACE(n)。 根 据 
空间 层次 定理 ，A 是 存在 的 。 因 为 在 填充 语言 里 消耗 的 空间 是 线性 的 ， 存 在 足够 的 空间 运 
TAKOR) 空间 算法 ， 所 以 pad(A,n?:)ESPACE(n)。 根 据 假 设 ，pad(A,n:)EP， 因 此 
根据 (a) PRUE, ACP, Mii AE SPACE(n)。 推 出 了 矛盾 。 
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本 章 简要 地 介绍 复杂 性 理论 中 的 几 个 其 他 专题 。 这 是 一 个 非常 活跃 的 研究 领域 ， 包 
含 独 丰富 的 研究 内 容 。 本 章 涉及 很 多 更 为 高 级 的 专题 内 容 ， 但 不 是 对 所 有 问题 进行 全 面 
综述 。 需 要 特别 指出 的 是 ， 其 中 有 两 个 重要 的 专题 超出 了 本 书 的 范围 ， 它 们 分 别 是 : 量 
子 计算 (quantum computation) 和 概率 可 核查 证 明 (probabilistically checkable proof) 。 
«The Handbook of Theoretical Computer Science) [74] 提供 了 关于 计算 理论 早期 工作 的 

本 章 的 主要 内 容 包括 近似 算法 、 概 率 算 法 、 交 互 式 证 明 系 统 、 并 行 计 算 以 及 密码 学 
等 。 除 了 交互 式 证 明 系 统 和 密码 学 两 节 中 用 到 概率 算法 之 外 ， 其 他 各 节 都 是 相互 独立 的 。 
10.1 近似 算法 

在 有 的 问题 如 最 优化 问题 (optimization problem) 中 ， 我 们 试图 在 所 有 的 可 行 解 中 找 
到 最 好 的 解 。 例 如 ， 寻 找 图 中 的 最 大 团 ， 最 小 顶点 覆盖 ， 或 者 两 个 顶点 之 间 的 最 短路 径 
等 。 前 两 个 问题 是 NP 难 解 问 题 。 当 最 优化 问题 是 NP 难 解 问题 的 时 候 ， 不 存在 找到 最 好 
解 的 多 项 式 时 间 算 法 ， 除 非 P=NP. 

在 实践 中 ， 找 到 绝对 最 好 的 解 通常 较为 困难 ， 而 且 可 能 用 户 并 非 一 定 要 找到 某 个 问题 
的 绝对 最 好 的 解 ， 即 最 优 解 。 一 个 接近 最 优 的 解 可 能 已 经 足够 好 ， 而 且 可 能 更 容易 找到 。 
顾名思义 ， 近 似 算 法 (approximation algorithm) 是 为 寻求 这 种 近似 最 优 解 而 设计 的 。 

例如 ， 考 虑 7. 5 节 所 讨论 的 顶点 覆盖 问题 。 顶 点 覆盖 问题 被 描述 为 一 个 表示 判定 问题 
(decision problem) 的 语言 YERTEX-COVER 。 判 定 问 题 只 有 两 个 答案 一 一 是 或 非 。 该 问 
题 的 最 优化 形式 记 作 MIN- VERTEX-COVER, 。 任 意 给 定 一 个 图 ， 其 目标 是 在 所 有 可 能 的 
顶点 覆盖 中 找到 一 个 最 小 的 顶点 覆盖 。 下 述 多 项 式 时 间 算 法 近似 地 解 这 个 最 优化 问题 。 它 
给 出 一 个 顶点 覆盖 ， 其 规模 不 超过 最 小 顶点 覆盖 的 2 倍 。 

A= 对 于 和 输入 人 G)， 这 里 G 是 一 个 无 向 图 。 

1. 重复 下 述 操作 直至 G 中 所 有 的 边 都 与 有 标记 的 边 相 邻 。 
2. 在 G 中 找 一 条 不 与 任何 有 标记 的 边 相 邻 的 边 。 

3. 给 这 条 边 作 标记 。 

4. 输出 所 有 有 标记 的 边 的 顶点 。” 

上 述 算 法 A 是 一 个 多 项 式 时 间 算 法 ， 它 给 出 G 的 一 个 顶点 履 盖 ， 其 规 
模 不 超过 G 的 最 小 顶点 履 盖 的 2 倍 。 

证 明 A 的 运行 时 间 显 然 是 多 项 式 界 限 的 。 设 X 是 它 输 出 的 顶点 集合 ， 互 是 有 标记 
的 边 的 集合 ， 因 为 G 的 每 一 条 边 要 么 属于 互 ， 要 么 与 互 中 的 一 条 边 相 邻 ， 所 以 与 G 中 
所 有 的 边关 联 。 因 此 ，X 是 一 个 顶点 覆盖 。 

为 了 证 明 X 的 规模 不 超过 最 小 顶点 覆盖 Y 的 2 倍 ， 我 们 要 确认 两 个 事实 : X 中 顶点 
的 数目 大 小 是 五 的 2 倍 和 互 不 大 于 Y。 首 先 ， 互 中 的 每 一 条 边 为 X 提供 2 个 顶点 ， 从 而 
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X 中 顶点 的 数目 大 小 是 互 的 2 倍 。 其 次 , Y 是 一 个 顶点 覆盖 ， 从 而 H 中 的 每 一 条 边 与 Y 
中 的 某 个 顶点 关联 。 由 于 五 中 的 边 互 不 相 邻 ， 故 了 中 的 顶点 不 可 能 同时 关联 互 中 的 两 条 
边 。 由 于 立 中 有 不 同 的 顶点 关联 互 中 的 每 一 条 边 ， 所 以 顶点 覆盖 了 不 小 于 瓦 。 因 此 ，X 
中 顶点 的 数目 大 小 不 超过 了 的 2 倍 。 = 

MIN-VERTEX-COVER 是 一 个 最 小 化 问题 (minimization problem) ， 因 为 我 们 的 目 
标 是 求 可 行 解 中 最 小 的 解 。 在 最 大 化 问题 (maximization problem) 中 ， 我 们 试图 求 最 大 
的 解 。 如 果 一 个 最 小 化 问题 的 近似 算法 总 能 找到 不 超过 最 优 解 k 倍 的 可 行 解 ， 则 称 这 个 算 
法 是 kK- 优 的 〈A-optimal) 。 前 面 关 于 顶点 覆盖 问题 的 算法 是 2- 优 的 。 对 于 最 大 化 问题 ， 一 


个 大 优 近似 算法 总 能 找到 不 小 于 最 优 解 大 小 的 去 的 可 行 解 。 


下 面 是 最 大 化 问题 MAX-CUT 的 近似 算法 。 把 顶点 集 V 划分 成 两 个 互 不 相交 的 子 集 
S 和 耳 ， 称 为 无 向 图 中 的 割 〈cut) 。 一 个 顶点 在 S 中 ， 另 一 个 顶点 在 工 中 的 边 对 称 作 割 边 
(cut edge) 。 如 果 一 条 边 不 是 割 边 ， 则 称 作 非 割 边 〈uncut edge). HA HIZ H PRIE SKIK 
小 。MAX-CUT 求 输入 图 G 中 的 最 大 割 。 正 如 在 问题 7. 54 中 所 说 明 的 ， 该 问题 是 NP 完 
全 问题 。 下 述 算 法 因子 2 的 范围 内 在 近似 MAX-CUT. 

B= 二 “对 于 输入 (G)， 这 里 G 是 顶点 集 为 V 的 无 向 图 : 

1. + S= øm T=V. 

2. 如 果 把 一 个 顶点 从 S$ 移 到 了 或 从 工 移 到 S$S， 使 割 的 大 小 变 大 ， 则 做 这 样 的 移 
动 ， 并 且 重 复 这 一 步 。 

3. 如 果 不 存在 这 样 的 顶点 ， 则 输出 当前 的 割 并 且 停 止 。” 

该 算法 从 一 个 (假定 是 ) 坏 的 割 开始 ， 然 后 做 局 部 改进 ， 直 到 不 能 进一步 做 局 部 改进 
为 止 。 虽然 这 个 过 程 一 般 不 能 给 出 最 大 的 割 ， 但 是 可 以 证 明 ， 它 给 出 的 割 的 大 小 至 少 是 最 
大 割 大 小 的 一 半 。 

上 述 算 法 B 是 MAX-CUT 的 2- 优 的 多 项 式 时 间 近 似 算法 。 

证 明 由 于 每 次 执行 步骤 2 增加 割 的 大 小 ， 而 割 的 大 小 不 超过 G 的 边 数 ， 故 B 在 多 项 
式 时 间 内 运行 。 

现在 证 明 B 输出 的 割 不 小 于 最 大 割 的 一 半 。 实 际 上 ， 要 证 明 更 强 的 结论 : B 输出 的 割 
至 少 包 含 G 中 所 有 边 的 一 半 。 观 察 到 ， 在 G 的 每 一 个 顶点 ， 割 边 不 少 于 非 割 边 ， 否 则 B 
要 把 该 顶点 移 到 另 一 边 。 把 所 有 顶点 的 割 边 数 加 在 一 起 ， 这 个 和 是 割 边 总 数 的 2 倍 ， 因 为 
每 一 条 制 边 对 它 的 两 个 端点 各 计算 一 次 。 根 据 前 面 的 观察 ， 这 个 和 不 小 于 所 有 顶点 非 割 边 
数 之 和 。 于 是 ，G 中 的 割 边 不 少 于 非 割 边 ， 从 而 B 输出 的 割 中 至 少 包 含 所 有 边 的 一 半 。 于 


10.2 概率 算法 


概率 算法 以 随机 过 程 为 工具 。 典 型 算法 包含 一 条 “ 掷 硬币 ”的 指令 ， 并 且 掷 便 币 的 结 
果 可 能 影响 算法 后 面 的 执行 和 输出 。 对 某 些 类 型 的 问题 ， 相 对 于 确定 型 算法 ， 用 概率 算法 
更 容易 解决 。 

对 于 一 个 具体 的 计算 任务 ， 用 掷 硬币 做 出 决定 怎么 能 比 通过 实际 计算 或 者 佑 计 而 得 到 
的 最 好 的 选择 更 好 呢 ? 有 时 ， 计 算 最 好 的 选择 可 能 需要 过 多 的 时 间 ， 而 估计 则 可 能 带 有 偶 
好 ， 使 得 出 的 结论 无 效 。 例 如 ， 统 计 学 家 用 随机 抽样 确定 有 关 一 个 大 的 群体 中 所 有 人 的 信 
息 ， 如 他 们 的 爱好 或 政治 倾 问 。 调 查 所 有 的 人 可 能 需要 太 长 的 时 间 ， 调 查 一 部 分 随机 挑选 
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出 来 的 人 则 可 能 得 出 错误 的 结论 。 
10.2.1 BPP 类 


为 了 更 为 形式 化 地 讨论 概率 计算 问题 ， 这 里 首先 定义 一 个 新 的 计算 模型 一 一 概率 图 灵 
机 ， 然 后 介绍 一 个 与 高 效 的 概率 计算 相关 的 复杂 性 类 并 给 出 几 个 例子 。 

概率 图 灵机 (probabilistic Turing Machine) M 是 一 种 非 确 定型 图 灵机 ， 
它 的 每 一 非 确 定性 步 称 作 丘 硬币 步 (coin-flip step)， 并 且 有 两 个 合法 的 下 步 动 作 。 按 照 下 
述 方式 把 概率 赋 给 M 对 输入 w 的 每 一 个 计算 分 支 5。 定 义 分 支 6 的 概率 为 

Pri 6} = 24 
其 中 , RRAED KD 中 出 现 的 掷 硬币 步 的 步 数 ， 定 义 M 接受 ww 的 概率 为 
P[M#2%w]= >， Pr[6b] 
0 是 接受 分 支 

换言之 ， 如 果 模 拟 M 对 w 的 计算 ， 在 每 一 掷 便 币 步 ， 用 掷 硬币 决定 下 一 步 的 动作 ， 

m M 接受 w 的 概率 等 于 它 到 达 接 受 格 局 的 概率 。 令 
Pr[ M #24 w ]= 1— Pr[M #3 w |] 

通常 ， 当 概率 图 灵机 接受 属于 某 一 语言 的 所 有 字符 串 并 且 拒 绝 不 在 这 个 语言 中 的 所 有 

字符 串 时 ， 称 概率 图 灵机 判定 该 语言 。 但 是 如 果 人 允许 机 器 有 小 的 错误 概率 ， 如 对 于 某 个 正 


M e(0<e<>), MR 


1. wEA 蕴涵 Pr[M 接受 w ] 宇 1 一 e， 并 且 

2. wEA AW PrLM 拒绝 ww ] 之 1 一 e， 
则 称 M 以 错误 概率 判定 语言 A。 换 句 话 说 ,模拟 M 得 到 错误 答案 的 概率 至 多 为 s。 我 们 
接 下 来 考虑 错误 概率 的 边界 。 错 误 概率 的 边界 依赖 于 输入 串 的 长 度 n。 例 如 ， 错 误 概 率 e 二 
2 "表示 指数 地 小 的 错误 概率 。 

我 们 感 兴趣 的 是 在 时 间 和 空间 上 运行 高 效 的 概率 算法 。 度 量 概率 图 灵机 的 时 间 和 空间 
复杂 度 的 方法 与 度量 非 确 定型 图 灵机 的 一 样 ， 使 用 对 每 一 个 输入 的 最 坏 情 况 下 的 计算 
at 3h 


BPP 是 多 项 式 时 间 的 概率 图 灵机 以 错误 概率 二 判定 的 语言 类 。 
我 们 以 错误 概率 -定义 BPP。 但 是 根据 下 述 加 强 引 理 (amplification lemma), ， 任 何 严 


格 地 在 0 和 二 之 间 的 常数 错误 概率 都 给 出 等 价 的 定义 。 这 个 引 理 提供 了 一 种 简单 的 方法 使 
错误 概率 指数 地 小 。 注 意 : 错误 概率 为 2-1o 的 概率 算法 ， 由 于 运行 它 的 计算 机 的 硬件 失 
灵 ， 给 出 错误 结果 的 可 能 性 远大 于 由 于 括 硬 币 不 走运 给 出 错误 结果 的 可 能 性 

设 。 是 一 给 定 的 常数 ， 且 0<e 二 万。 又 设 Mi 是 一 台 错误 概率 为 上 的 多 
项 式 时 间 概 率 图 灵机 ， 则 对 于 任意 给 定 的 多 项 式 p(n)， 存 在 与 Mi 等 价 的 错误 概率 为 
2-0 的 多 项 式 时 间 概率 图 灵机 Mb. 

证 明 思路 ”Mz 用 如 下 方式 模拟 M: 运行 Mi 多 项 式 次 ， 并 且 取 这 些 运行 结果 中 的 多 
数 作为 计算 结果 。 错 误 概率 随 MI 的 运行 次 数 指数 地 下 降 。 


考虑 e 一 于 时 的 情况 。 这 对 应 于 一 只 装 有 许多 红 球 和 蓝 球 的 盒子 。 已 知 气 的 球 是 一 种 


颜色 ， 其 余地 的 球 是 另 一 种 颜色 ， 但 是 不 知道 哪 一 种 颜色 的 球 多 。 随 机 地 抽取 若干 个 球 


(例如 ，100 个 ) ， 看 哪 一 种 颜色 的 频率 高 ， 以 此 能 够 检验 哪 一 种 颜色 多 。 几 乎 可 以 肯定 ， 
盒 中 数量 多 的 颜色 在 样本 中 的 频率 高 。 

这 些 球 对 应 Mi 的 计算 分 支 : 红色 对 应 接受 分 文 ， 蓝 色 对 应 拒绝 分 支 。Ms 借助 运行 
Mi 对 颜色 取样 。 计 算 表 明 ， 如 果 M: 运行 Mi 多 项 式 次 ， 并 且 输 出 出 现 频率 高 的 结果 ， 则 
M2 犯错 误 的 概率 指数 地 小 。 


证 明 ”给 定 图 灵机 MI 和 多 项 式 p(n), M 以 错误 概率 6 志趣 判 定 一 个 语言 ， 要 构造 


下 述 图 灵机 M; ， 它 以 错误 概率 27° 判定 同一 语言 。 
MM 一 “对 输入 x: 
1. 计算 的 值 〈 请 注意 下 面 的 分 析 )。 
2. 对 输入 x 进行 2k 次 独立 的 Mi 模拟 运行 。 
3. WR Mi 接受 工 的 次数 多 ， 则 接受 ; 否则 拒绝 。” 
我 们 设法 限定 9 M: 在 输入 x 上 运行 错误 的 概率 。 阶 段 2 产生 一 个 由 模拟 Mi 得 到 的 
2k 个 结果 的 序列 ， 每 个 结果 要 么 正确 要 么 错误 。 如 果 这 些 结果 大 多 数 都 正确 ，M: 给 出 正 
确 的 回答 。 我 们 限定 概率 为 至 少 一 半 的 结果 都 是 错误 的 。 
假定 S 表示 阶段 2 中 Me 得 到 的 结果 序列 。 令 Ps 表示 Me 得 到 S 的 概率 。 假 定 S 中 
Ac 个 正确 的 结果 ，w 个 错误 的 结果 ， 我们 有 ctrw=2k, WR Kw FH M: 得 到 S， 那 
Z M: 输出 不 正确 。 我 们 把 这 样 的 序列 S 称 为 坏 的 序列 。 令 sz 是 Mi 在 zx 上 出 错 的 概率 。 
如 果 $ 是 一 个 坏 的 序列 ， 那 么 Ps<le)”(—e:) o MF ee Sex<l/2, Pree (C1 —e< 
ell 一 ey BA 委员 Ps 至 多 是 em(]1 一 se) 此外; AW kw, excl—e, PFW ede)" 
EES aI « 
对 所 有 S 为 坏 序 列 的 情况 Ps 求 和 ， 即 得 到 M: 输出 不 正确 的 概率 。 坏 序列 至 多 有 27 
个 ， 这 是 显而易见 的 ， 因 为 所 有 不 同 序列 的 总 数 为 2%*。 因 此 ， 得 到 如 下 等 式 : 
Prl M: 在 输入 x 上 输出 不 正确 
= >» Pa 2" +e =e)" = (Hell— oy 
坏 的 S 


由 于 假定 e< >, RIE 4e(1 一 所 二 1。 因 此 ， 上 述 概率 将 随 & 的 增加 指数 地 减少 ， 
Mz 的 错误 概率 也 将 随 的 增加 指数 地 减少 。 为 得 到 一 个 特定 的 & 值 ， 使 得 我 们 能 很 好 地 
将 M: 的 错误 概率 限定 在 小 于 2”:〈 其 中 tS1), RNS ae 一 一 logz (4e(1 一 e))， 并 选择 过 
tja, 于是， 我们 得 到 多 项 式 时 间 内 的 错误 概率 2, s 
10.2.2 素数 性 

素数 是 大 于 1 并 且 不 能 被 1 和 自身 以 外 的 任何 正 整数 除 尽 的 整数 。 大 于 1 a 


O ”错误 概率 的 分 析 来 自 切 诺 夫 界限 ， 这 是 概率 论 中 一 个 公认 的 标准 结果 。 这 里 我 们 给 出 一 个 替代 的 、 自 包含 的 
计算 ， 它 避免 了 对 该 结果 的 依赖 。 
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作 合 数 。 判 断 一 个 整数 是 素数 还 是 合 数 是 一 个 非常 古老 的 问题 ， 有 很 多 相关 的 研究 。 现 在 
已 经 有 了 解决 该 问题 的 多 项 式 时 间 算 法 [4]。 但 是 ， 由 于 种 种 原因 ， 可 能 不 适合 在 这 里 讲 
述 过 多 关于 该 工作 的 实现 细节 。 在 本 节 中 ， 我 们 描述 一 个 简单 得 多 的 检验 一 个 数 是 素数 还 
是 合 数 的 多 项 式 时 间 概 率 算 法 。 

判定 一 个 数 是 否 是 素数 ， 一 种 最 直接 的 方法 是 检查 所 有 小 于 这 个 数 的 整数 ， 看 是 否 有 
能 整除 这 个 数 的 数 ， 即 因子 。 由 于 数 的 大 小 是 随 它 的 长 度 呈 指数 增长 的 ， 故 这 个 算法 具有 
指数 时 间 复 杂 度 。 我 们 要 描述 的 测试 素数 性 的 概率 算法 的 运行 方式 完全 不 同 。 它 不 搜索 因 
子 。 实 际 上 ， 还 没有 找到 求 因子 的 多 项 式 时 间 概 率 算法 。 

在 讨论 算法 之 前 ， 首 先 回 顾 一 下 数论 中 的 某 些 表示 法 。 在 本 小 节 中 讨论 的 所 有 数 都 是 
整数 。 对 于 任 一 大 于 1 的 数 p， 如 果 两 个 数 仅 相差 p 的 整数 倍 ， 我 们 说 两 个 数 是 模 p 等 价 
的 。 如 果 工 和 y 是 模 p 等 价 的 ， 则 记 作 z=y(mod p). & x mod p 等 于 使 Xx 圭 y(mod p) 
的 最 小 非 负 数 y。 为 方便 起 见 ， 令 Z。 表 示 和 集合 {1,…,p 一 1}，2Zb 表示 {0,…,p 一 1}， 则 
每 个 数 都 和 Z， 中 的 某 个 数 是 模 p 等 价 的 。 我 们 可 以 用 该 集合 以 外 的 数 表示 该 集合 中 与 之 
模 p 等 价 的 数 。 比 如 ， 可 以 用 一 1 表示 p 一 1。 

算法 背后 的 主要 思想 源 于 下 述 费 马 小 定理 (Fermat’s little thereom)。 

如 果 pp 是 素数 ， 且 4a€2Vi ， 则 a’'=1(mod p). 

例如 ， 如 果 p= 二 7,a= 二 2， 则 定理 称 因 为 7 是 素数 ， 所 以 2" 了 mod 7 一定 等 于 1。 经 过 
简单 几 步 计算 


20-1) — 26 = 64, 64 mod 7 = 1 
可 以 证 实 这 个 结论 。 假 如 用 p 二 6 试 试 ， 那么 ， 
26-1) — 25 = 32, 32 mod 6 = 2 


得 到 的 结果 不 是 1。 根 据 这 个 定理 ，6 不 是 素数 。 当 然 ， 我 们 早已 知道 6 不 是 素数 。 但 是 ， 
这 个 方法 不 用 找到 它 的 因子 ， 就 能 证 明 6 是 合 数 。 问 题 10. 16 要 求 给 出 这 个 定理 的 证 明 。 
可 以 把 上 述 定理 看 作 一 种 “测试 ”素数 的 方法 ， 称 为 费 马 测 试 (Fermat test), 4R 
们 说 p 通过 在 a 的 费 马 测试 ， 是 指 a? '=1 (mod p)。 该 定理 说 明 ， 任 意 素 数 p 都 能 够 通 
过 关于 所 有 aEZ， 的 费 马 测试 。 观 察 发 现 6 不 能 通过 某 些 费 马 测 试 ， 因 此 6 不 是 素数 。 
能 不 能 利用 费 马 测试 给 出 判定 素数 性 的 算法 ? 几乎 可 以 。 如 果 一 个 数 能 够 通过 所 有 关 
于 小 于 它 且 与 它 互 素 的 数 的 费 马 测试 ， 则 称 这 个 数 是 伪 素 数 (pseudoprime)。 除 了 相对 来 
说 少量 的 卡 米 切 尔 数 (Carmichael number) 外 ， 所 有 的 伪 素 数 都 是 素数 。 卡 米 切 尔 数 是 
合 数 ， 但 能 通过 所 有 比 它 小 且 互 素 的 数 的 费 马 测试 。 下 面 首 先 给 出 测试 伪 素 数 的 多 项 式 时 
间 概 率 算法 ， 然 后 给 出 能 够 完全 测试 素数 性 的 多 项 式 时 间 概 率 算 法 。 
判定 一 个 数 是 否 具 有 伪 素 数 性 ， 要 对 之 进行 全 部 的 费 马 测试 ， 因 此 判定 伪 素 数 性 的 算 
法 需要 指数 时 间 。 多 项 式 时 间 概 率 算法 的 关键 是 ， 如 果 一 个 数 不 是 伪 素 数 ， 则 它 至 少 不 能 
通过 全 部 费 马 测试 的 一 半 。 (我 们 暂时 接受 这 个 断言 。 问 题 10. 14 要 求 给 出 它 的 证 明 。) 算 
法 随机 进行 若干 次 测试 。 如 果 有 一 次 测试 没有 通过 ， 则 这 个 数 一 定 是 合 数 。 如 果 测 试 都 通 
过 ， 则 这 个 数 很 可 能 是 一 个 伪 素 数 。 算 法 含有 一 个 用 来 确定 错误 概率 的 参数 &。 
PSEUDOPRIME=“xt# A p: 
1. Æ Z; 中 随机 地 选取 ai,，…，,ak。 
2. 对 于 每 一 个 i 计算 rile mod p. 
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3. 如 果 所 有 计算 值 都 等 于 1， 则 接受 ; 否则 拒绝 。” 
如 果 p 是 伪 素 数 ， 则 它 能 通过 全 部 测试 ， 从 而 算法 一 定 会 接受 。 如 果 p 不 是 伪 素 数 ， 
则 它 至 多 能 通过 全 部 测试 的 一 半 。 在 这 种 情况 下 ， 它 通过 每 一 个 随机 选择 的 测试 的 概率 不 


大 于 志 。 于 是 ， 它 通过 全 部 个 随机 选择 的 测试 概率 不 大 于 2-*。 因 为 模 指数 是 多 项 式 时 


间 内 可 计算 的 〈( 见 问题 7. 40)， 故 这 个 算法 在 多 项 式 时 间 内 运行 。 

为 了 把 这 个 伪 素 数 性 算法 转换 成 素数 性 算法 ， 我 们 引入 更 为 复杂 的 测试 ， 以 避免 卡 米 
切 尔 数 带 来 的 问题 。 基 本 原理 是 ， 对 于 任 一 素数 p，1 恰好 有 两 个 模 p 的 平方 根 ， 即 1 和 
一 1。 对 于 许多 合 数 ， 包 括 所 有 的 卡 米 切 尔 数 在 内 ，1 有 4 个 或 更 多 的 平方 根 。 例 如 ， 土 1 
和 士 8 是 1 模 21 的 4 个 平方 根 。 如 果 一 个 数 通 过 在 a 的 费 马 测试 ， 则 算法 随机 地 求 1 模 这 
个 数 的 一 个 平方 根 ， 并 且 看 这 个 平方 根 是 否 是 1 或 一 1。 如 果 不 是 ， 则 这 个 数 不 是 素数 。 

如 果 p 通过 在 a 的 费 马 测试 ， 由 于 at mod p=1, Mii aT mod p 是 1 的 一 个 平方 
根 。 如 果 这 个 值 仍 是 1， 则 可 以 重复 用 2 除 指数 ， 只 要 得 到 的 指数 仍 是 整数 ， 然 后 看 第 一 
个 不 为 1 的 值 是 一 1， 还 是 某 个 其 他 的 数 。 下 面 描述 这 个 算法 ， 并 且 给 出 它 的 正确 性 的 形 
式 证 明 。 取 & 宇 1 作为 一 个 参数 ， 它 确定 最 大 错误 概率 为 2 天 。 

PRIME 二 “对 输入 p: 

l. Æ p 是 侦 数 ， 则 如 果 p 二 2， 则 接受 ; 否则 拒绝 。 

2. Æ Z) 中 随机 地 选取 al,… ,ax。 

B Af i=l, mR 

4. 计算 aP-'mod p, FAWMRASF 1, WIA. 

5 & p—l=s-2!', HPs BPR. 

6 ”计算 序列 ai'? at? 5+, 03°? mod p. 
如 果 该 序列 中 的 某 个 数 不 等 于 1， 则 找到 最 后 一 个 不 等 于 1 的 数 。 如 果 这 
个 数 不 等 于 一 1， 则 拒绝 。 

8. 这 时 已 经 通过 全 部 测试 ， 故 接受 。” 

下 述 两 个 引 理 证 明 算 法 PRIME 是 正确 的 。 当 p 是 偶数 时 ， 算法 显然 正确 。 因 此 我 们 
RE EY p 为 奇数 时 的 情况 。 如 果 算 法 PRIME 使 用 a; 在 步骤 4 或 步骤 7 拒绝 ， 则 称 ai; 
是 一 个 ( 合 数 性 ) 见证 ((compositeness) witness), 

如 果 pp 是 一 个 奇 素数 ， 则 Pr[PRIME 接受 p]==1。 

证 明 首先 要 证 明 如 果 p 是 素数 ， 则 不 存在 见证 ， 因 而 不 存在 算法 的 拒绝 分 支 。 如 果 
a 是 步骤 4 中 的 见证 ， 即 a?-!mod p 关 1， 根 据 费 马 小 定理 ，p 是 合 数 。 如 果 a 是 步骤 7 中 
的 见证 ， 则 存在 5€ Zs 使 得 6 关 土 1(mod p) Al b?=1(mod p)。 于 是 ,0b? 一 1 圭 0(mod p). 
因子 分 解 太一 1， 得 到 

(6—1)(b+1) = 0(mod p) 
因而 存在 正 整 数 c， 使 得 
(b—1)(6+1) = cp 
因为 bA+1(mod p), ， 所 以 8 一 1 和 2 十 1 都 严格 地 在 0 和 p 之 间 。 而 一 个 素数 的 倍数 不 能 
表示 成 小 于 它 的 数 的 乘积 ， 故 p EAR. s 
下 述 引 理 显示 算法 以 很 高 的 概率 识别 合 数 。 首 先 ， 我 们 引用 数论 中 的 一 个 重要 的 基本 
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工具 。 如 果 两 数 没有 除 1 以 外 的 公 因 数 ， 则 说 两 数 互 素 。 中 国 剩 余 定理 (Chinese remainder 
thereom) KH, WR p 和 9g ER, WH Zw AZ, XZ, 间 存 在 一 一 上 映射。 每 个 数 re Zp, 对 
应 于 一 个 对 (a,b), HHa€Z,,b€Z,, (1 r=almod p), H r=b(mod q). 

如 果 思 是 一 个 奇 合 数 ， 则 Pr[PRIME BE p ]<2-*. 

证 明 ”如 下 所 示 ， 如 果 p 是 奇 合 数 ，a 是 从 Z。 中 随机 选取 的 一 个 数 ， 则 


Pra $A AE] 六 = 


这 只 需要 证 明 在 Z。 中 见证 至 少 和 非 见 证 一 样 多 。 为 此 ， 对 每 一 个 非 见 证 我 们 设法 找到 一 
个 与 它 对 应 的 独 有 的 见证 。 
对 于 每 一 个 非 见证 ， 在 步骤 6 中 计算 的 序列 要 么 都 是 1， 要 么 含有 一 个 一 1， 这 个 一 1 的 
后 面 跟着 1。 例 如 ，1 本 身 是 第 一 类 非 见证 。 由 于 * 是 奇数 ，( 一 1) 2 二 一 1 且 ( 一 1)s*? =1, 
故 一 1 是 第 二 类 非 见 证 。 在 所 有 第 二 类 非 见 证 中 ， 找 出 一 个 一 1 在 序列 中 的 最 大 位 置 的 非 
见证 。 设 这 个 非 见证 是 及 ， 一 1 在 它 的 序列 中 的 位 置 为 ;， 这 里 序列 位 置 从 ORR. TE, 
hs*?’=—1(mod p). 
由 于 馆 是 合 数 ， 所 以 或 者 丸 是 一 个 素数 的 寡 ， 或 者 可 以 把 它 写 成 两 个 互 素 的 数 g Mr 
的 乘积 。 我 们 首先 考虑 后 一 种 情况 。 根 据 中 国 剩余 定理 ， 在 Z。 中 存在 一 个 数 上 ， 使 得 
t =h(mod q) 
t =] (mod r) 
因此 ， 
t? 三 一 1(mod q) 
t2? =1(mod r) 
因为 t? ~A+1(mod p) BẸ tt? =1(mod p)， 所 以 1 是 一 个 见证 。 
现在 我 们 得 到 了 一 个 见证 ， 还 可 以 得 到 更 多 的 见证 。 根 据 下 述 两 点 观察 ， 可 以 证 明 对 
于 每 一 个 非 见证 d, dt mod p 是 与 它 对 应 的 独 有 的 见证 。 首 先 ， 根 据 选择 j Worst, a? = 
+1(mod p) H d’? =1(mod p). HIE, dt mod p 是 一 个 见证 ， 因 为 (41)s*? 关 土 1 而 且 
(di):*? =1 (mod Dja 
EX, WRd Md: 是 两 个 不 同 的 非 见 证 ， 则 dit mod pAd2t mod p。 这 是 因为 
fs*2 mod p=1, Mmi ters’? -1 mod p= 二 1。 所 以 ， 如 果 td, mod p= 二 td; mod p， 则 
dı 一 ii -ld mod p=te t*2’""—1 d mod p = dz 
所 以 ， 见 证 不 会 比 非 见 证 少 。 这 样 ， 我 们 证 明了 p RETRAIN TL. 
aT pe TREN ML, 我们 有 p 二 qf， 其 中 gq 是 一 个 素数 ，e>1。 令 :一 1 十 
。 使 用 二 项 式 定 理 扩展 多 项 式 t? 可 以 得 到 
太一 (1 十 go 和 1)2 一 1 十 力 。q lte) 更 高 次 轿 的 倍数 
这 和 1 mod p 是 等 价 的 。 因 此 ，: 是 一 个 阶段 4 见证 。 这 是 因为 : 如 果 -1 二 1 (mod p), 
则 2?=tAl(mod p)。 像 前 一 个 例子 一 样 ， 可 以 用 这 个 见证 去 获取 其 他 很 多 见证 。 如 果 a 
是 一 个 非 见 证 ， 则 d?-'=1(mod p), FÆ, dt mod p 是 一 个 见证 。 更 进一步 ， 如 果 d1 和 
d: 是 两 个 不 同 的 非 见 证 ， 则 dit mod p#dz2t mod p. BM, 
dı = dı » t» tt! mod p = dz •» t + tt mod p = d2 


因此 ， 见 证 的 数目 一 定 和 非 见证 的 数目 一 样 多 ,证 毕 。 a 

上 述 算法 及 对 它 的 分 析 给 出 下 述 定理 。 令 

PRIMES = {n |n 是 二 进 制 的 素数 } 

PRIMES€E BPP, 

注意 ， 这 个 素数 性 概率 算法 具有 单 侧 错误 (one-sided error)。 当 算法 输出 拒绝 时 ， 输 
入 一 定 是 合 数 ， 当 输出 接受 时 ， 我 们 只 知道 输入 可 能 是 素数 或 合 数 。 因 此 ， 只 有 当 输 入 是 
合 数 时 ， 才 可 能 出 现 错误 的 回答 。 单 侧 错误 是 许多 概率 算法 的 共同 特点 ， 因 而 我 们 为 它 指 
定 一 个 专门 的 复杂 性 类 RP。 

Pate) RP 是 多 项 式 时 间 概率 图 灵机 识别 的 语言 类 ， 在 这 里 ， 在 语言 中 的 输入 
以 不 小 于 过 的 概率 被 接受 ， 不 在 语言 中 的 输入 以 概率 1 被 拒绝 。 


用 类 似 于 引 理 10. 5 中 使 用 的 概率 加 强 技术 (实际 上 这 里 更 简单 些 )， 可 以 使 错误 概率 
指数 地 小 ， 并 且 保 持 多 项 式 运 行 时 间 。 前 面 的 算法 表明 COMPOSITESE RP. 


10.2.3 只 读 一 次 的 分 支 程序 

分 支 程序 是 复杂 性 理论 和 茶 些 实际 领域 〈 诸 如 计算 机 辅助 设计 ) 中 使 用 的 一 种 计算 模 
型 。 这 个 模型 表示 一 种 判定 过 程 ， 它 询问 输入 变量 的 值 ， 并 且 根 据 对 询问 的 回答 决定 如 何 
行进 。 我 们 把 这 样 的 判定 过 程 表 示 成 一 个 图 ， 它 的 顶点 对 应 于 判定 过 程 中 在 该 点 询问 的 
EE 

本 小 节 考 察 检 验 两 个 分 支 程 序 是 否 等 价 的 复杂 性 。 一 般 来 说 ， 这 个 问题 是 coNP 完全 
的 。 如 采 对 分 文 程序 类 作 某 种 自然 的 限制 ， 则 能 够 给 出 检验 等 价 性 的 多 项 式 时 间 概 率 算 
法 。 基 于 下 述 两 个 原因 ， 我 们 对 这 个 算法 特别 感 兴趣 。 首 先 ， 不 知道 这 个 问题 的 多 项 式 时 
间 算 法 ， 因 而 这 是 明显 扩大 了 能 够 有 效 检 验 成 员 资 格 的 语言 类 的 一 个 概率 例子 。 其 次 ， 为 
了 分 析 布 尔 函 数 的 性 状 ， 算法 引入 一 种 技术 ， 把 非 布 尔 值 赋 给 正常 的 布尔 变量 。 在 10.4 
廊 将 会 看 到 ， 这 种 技术 在 交互 式 证 明 系 统 中 起 很 大 作用 。 

分 支 程序 (branching program) 是 一 个 有 癌 无 环 图 。 其 中 ， 除 两 个 输 
出 顶点 (output node) 被 标记 为 0 或 1 外 ， 它 的 所 有 顶点 都 被 标记 为 变量 。 被 标记 为 变量 
的 顶点 叫 作 查 询 顶 点 (query node) 。 每 一 个 查询 顶点 引出 两 条 边 ， 一 条 标记 0， 另 一 条 标 
记 1。 两 个 输出 顶点 没有 引出 的 边 。 在 分 支 程 序 中 指定 一 个 顶点 为 起 始 顶 点 。 

分 支 程 序 能 够 确定 如 下 的 布尔 函数 。 对 查询 顶点 标记 的 所 有 变量 ， 任 取 一 个 赋值 ， 从 
起 始 顶 点 开始 ， 沿 途 在 每 一 个 查询 顶点 按照 赋 给 该 顶点 标记 的 变量 的 值 选 择 一 条 引出 的 
边 ， 直 至 到 达 一 个 输出 顶点 为 止 。 分 支 程 序 的 输出 就 是 该 输出 顶点 的 标记 。 图 10- 1 给 出 了 
两 个 分 支 程 序 的 例子 。 

分 文 程序 与 世 类 的 关系 类 似 于 布尔 电路 与 己 类 的 关系 。 问 题 10. 13 要 求证 明 多 项 式 个 
顶点 的 分 支 程 序 能 够 检验 (0,1) 上 任何 属于 工 的 语言 的 成 员 资 格 。 

如 采 两 个 分 文 程序 确定 的 函数 相同 ， 则 称 它 们 是 等 价 的 。 问 题 10. 9 要 求证 明 检 验 两 
个 分 文 程序 等 价 的 问题 是 coNP 完全 的 。 这 里 考虑 分 支 程序 的 一 种 受 限 制 的 形式 ， 只 读 一 





昌 有 向 图 如 果 没 有 有 向 环 ， 则 是 一 个 无 环 图 。 
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图 10-1 两 个 只 读 一 次 的 分 支 程序 


次 的 分 支 程序 (read- once branching program) 是 这 样 一 种 分 支 程序 ， 在 它 的 从 起 始 顶 点 
到 输出 顶点 的 每 一 条 有 向 路 径 上 ， 每 一 个 变量 至 多 能 被 查询 一 次 。 图 10- 1 中 的 两 个 分 支 
程序 都 是 只 读 一 次 的 。 令 
EQrosr = {(Bi,B2) | Bi 和 Bs 是 两 个 等 价 的 只 读 一 次 的 分 支 程 序 } 
Ae EQroeser Æ BPP F., 
证 明 思 路 ” 先 试 着 对 Bi MB: 中 出 现 的 所 有 变量 11, ,zm 赋 给 随机 的 值 ， 并 且 计 算 
这 两 个 分 支 程序 关于 这 个 赋值 的 输出 结果 。 如 果 B 和 Bs 关于 这 个 赋值 的 输出 结果 相同 ， 
则 接受 ; 否则 拒绝 。 但 是 ， 这 个 策略 是 行 不 通 的 。 因 为 两 个 不 等 价 的 只 读 一 次 的 分 支 程 序 
可 能 只 对 变量 的 2” 个 可 能 赋值 中 的 一 个 赋值 不 一 致 ， 选 取 到 这 个 赋值 的 概率 指数 地 小 ， 
从 而 当 Bi 和 Bo 不 等 价 时 ， 也 可 能 以 大 概率 接受 ， 这 是 不 能 令 人 满意 的 。 
修改 这 个 策略 ， 改 成 对 变量 随机 地 选取 一 个 非 布尔 赋值 ， 并 且 以 适当 规定 的 方式 计算 
Bı 和 B 的 值 。 能 够 证 明 当 Bi 和 Bo 不 等 价 时 ， 这 两 个 随机 计算 出 来 的 值 多 半 不 相等 。 
证 明 把 rison 的 多 项 式 赋 给 只 读 一 次 的 分 支 程 序 B 的 顶点 和 边 ， 步 又 如 下 : 把 
常数 函数 1 赋 给 起 始 顶 点 ， 如 果 标 记 工 的 顶点 已 经 被 赋 给 多 项 式 p， 则 把 多 项 式 rp KA 
从 这 个 顶点 引出 的 标记 1 的 边 ， 把 多 项 式 (1 一 x)p 赋 给 从 这 个 顶点 引出 的 标记 0 的 边 。 
如 果 进 入 某 个 顶点 的 所 有 边 都 已 被 赋 给 多 项 式 ， 则 把 这 些 多 项 式 的 和 赋 给 这 个 顶点 。 把 赋 
给 标记 1 的 输出 顶点 的 多 项 式 赋 给 这 个 分 支 程序 本 里 。 下 面 给 出 EQropP 的 多 项 式 时 间 概 
率 算法 。 设 三 是 一 个 至 少 含有 3m 个 元 素 的 有 限 域 。 
D= 二 “对 输入 〈B1,B;，，B]l 和 B: 是 两 个 只 读 一 次 的 分 支 程序 ; 
1. 在 大 中 随机 地 选取 m PICK 4a1,… Am 
2. 计算 赋 给 Bi 和 B: 的 多 项 式 pi 和 p: FE assam WE. 
3. 如 果 加 (aist sam) = p2 (aissam), WZ; 否则 拒绝 。” 
由 于 计算 分 支 程序 的 多 项 式 的 值 不 必 真 的 构造 出 这 个 多 项 式 ， 这 个 算法 可 以 在 多 项 式 
时 间 内 运行 。 下 面 证 明 它 以 不 超过 二 的 错误 概率 判定 EQRoap 。 
先 考察 分 文 程序 B 与 赋 给 它 的 多 项 式 p 之 间 的 关系 。 注 意 ， 对 于 B 的 变量 的 任何 布 
尔 赋值 ， 赋 给 顶点 的 所 有 多 项 式 的 值 都 为 0 或 1。 所 有 值 为 1 的 多 项 式 都 在 对 应 这 个 赋值 


的 计算 路 径 上 。 因 此 ， 当 变量 取 布 尔 值 时 ，B 和 jp 的 值 相 同 。 类 似 地 ， 由 于 B 是 只 读 一 次 
的 ， 可 以 把 p SRAM y1y2…ym 的 和 ， 这 里 每 一 个 yi Æ zi (1 一 zi;) 或 1， 而 且 每 一 个 
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积 项 对 应 于 B 中 一 条 以 起 始 顶 点 到 标记 1 的 输出 顶点 的 路 径 。 当 一 条 路 径 不 含 变 量 x; 时 ， 
m= ly 

取 p 的 每 一 个 这 种 含有 y; =1 的 积 项 ， 把 它 分 裂 成 两 个 积 项 的 和 ， 其 中 一 项 的 二 
Xi， 男 一 项 的 y; 二 1 一 x;。 由 于 1 二 zi 十 (1 一 zx;)， 这 样 得 到 一 个 等 价 的 多 项 式 。 继 续 分 裂 
积 项 ， 直 到 每 一 个 y 为 zi 或 者 (1 一 zx;) 为 止 。 最 后 得 到 一 个 等 价 的 多 项 式 qg， 对 于 使 B 
等 于 1 的 每 一 个 赋值 ，g 含有 一 个 积 项 。 下 面 着 手 分 析 算 法 D 的 性 状 。 

首先 证 明 ， 如 果 Bi 和 Bo 等 价 ， 则 D 总 是 接受 。 如 果 两 个 分 支 程 序 等 价 ， 则 它们 恰 
好 在 同样 的 赋值 取 值 为 1。 因而， 多 项 式 q 和 gs 包含 的 积 项 完全 一 样 ， 两 者 相等 。 所 以 ， 
pi 和 po 在 每 一 个 赋值 都 相等 。 


其 次 证 明 ， 如 果 B 和 By 不 等 价 ， 则 D 拒绝 的 概率 不 小 于 气 ， 这 个 结论 可 由 引 理 
10. 14 立即 得 到 。 外 

前 面 的 证 明 依赖 下 述 引 理 。 它 涉及 随机 地 找到 多 项 式 的 一 个 根 的 概率 ， 这 个 概率 与 多 
项 式 的 变量 数 、 变 量 的 次 数 以 及 基础 域 的 大 小 有 关 。 

Ee TAA d>0, REx thed 次 多 项 式 p 或 者 最 多 有 d AR, 或 者 





证 明 对 4 作 归 纳 。 

归纳 基础 : 对 d=O 的 证 明 。0 次 多 项 式 是 一 个 和 常数， 如果 这 个 常数 不 是 0， 则 多 项 式 
TARAR. 

归纳 步骤 : 假设 引 理 对 d 一 1 成立， 要 证 明 对 4 成 立 。 如 果 p 是 不 恒 为 0 的 d 次 多 项 
式 ， 它 有 一 个 根 a, 则 ac—a Bp. 于 是 ，。pYy lw 一 &》 是 不 恒 为 0 的 d 一 1 次 多 项 式 。 根 
据 归 纳 假设 ， 它 最 多 有 d—1 个 根 。 m 

ED 设 丰 是 f 个 元 素 的 有 限 域 ，p 是 Xx1，…,Zm 的 不 恒 为 0 的 多 项 式 ， 每 一 
个 变量 的 次 数 不 超 过 d。 如 果 aissam MPWAAF, M Pel play. mpl SO, 


J 

证 明 对 m FEIN A. 

归纳 基础 : 对 m= 二 1 的 证 明 。 根 据 引 理 10. 13，p 最 多 有 4d 个 根 ， 因 而 a 是 一 个 根 的 
概率 不 超过 d/ 了 。 

归纳 步骤 : 假设 引 理 对 m 一 1 成 立 ， 要 证 明 对 mm 成立 。 设 x1 是 pb 的 一 个 变量 。 对 于 
每 一 个 i 过 4, 令 pi 是 由 p PE ri 的 项 组 成 的 多 项 式 ， 但 这 里 zl 已 被 提出 来 。 于 是 

p = podxipi 二 xipz +° +r pa 

如 果 p(a1，,…,am) 二 0， 则 可 能 有 两 种 情况 。 或 者 所 有 pi 的 值 等 于 0 或 者 某 个 pi 的 值 不 等 
Fo, Ea 是 把 as，… sam 代入 por spa 后 得 到 的 一 元 多 项 式 的 根 。 

对 于 第 一 种 情况 ， 由 于 p 不 恒 为 0， 一 定 有 一 个 p 不 恒 为 0。 于 是 ， 所 有 pi 的 值 等 
于 0 的 概率 不 大 于 p 的 值 等 于 0 的 概率 。 根 据 归纳 假设 ,因为 p 最 多 有 m 一 1 个 变量 ， 
故 这 个 概率 不 大 于 (m 一 1)4/f， 

对 于 第 二 种 情况 ， 如 果 某 个 pi 的 值 不 为 0， 则 把 az ,…,aw RAJE, p 化 简 成 单 变量 
ri 的 多 项 式 ， 它 不 恒 为 0。 归 纳 假设 已 经 证 明 a 是 这 个 多 项 式 的 根 的 概率 不 大 于 5， 

KHE, aist ,am 是 多 项 式 p 的 根 的 概率 不 大 于 (m—1)d/f+d/f=md/f. 物 





BIOF 复 卖 性 理论 高 级 专题 257 


最 后 ， 在 算法 中 使 用 随机 性 时 ， 有 一 点 是 非常 重要 的 。 我 们 对 概率 算法 的 分 析 是 基于 
在 计算 时 有 可 供 使 用 的 真 随机 源 的 假设 的 。 但 是 ， 真 随机 源 可 能 是 很 难 〈 或 不 可 能 ) 获得 
的 ， 因 而 通常 用 伪 随 机 发 生 器 (psudorandom generator) 模拟 它 。 伪 随机 发 生 器 是 一 种 确 
定型 算法 ， 它们 的 输出 好 像 是 随机 的 。 虽然 任 何 确定 型 过 程 的 输出 绝 不 可 能 是 真 随机 的 ， 
但 是 某 些 确定 型 过 程 的 产生 结果 具有 随机 产生 结果 的 某 些 特征 。 随 机 性 的 算法 使 用 这 些 伪 
随机 发 生 需 时 ， 能 够 同样 好 地 工作 ， 但 是 证 明 一 般 是 非常 困难 的 。 实 际 上 ， 概 率 算 法 使 用 
某 些 伪 随 机 发 生 器 时 ， 有 时 不 能 很 好 地 工作 。 已 经 设计 出 非常 复杂 的 伪 随 机 发 生 器 ， 在 存 
在 单 向 盟 数 的 假设 下 ， 不 可 能 在 多 项 式 时 间 内 检验 出 它们 产生 的 结果 与 真 随机 结果 的 区 
别 。( 见 10. 6 节 关 于 单 向 函数 的 讨论 。) 


10.3 交错 式 


交错 式 是 非 确定 性 的 推广 ， 在 解释 复杂 性 类 之 间 的 关系 和 对 具体 问题 按照 复杂 性 进行 
分 类 时 ， 交 错 式 已 被 证 明 非 常 有 用 。 利 用 交错 式 ， 我 们 能 够 简化 复杂 性 理论 中 的 各 种 证 明 
和 展示 时 间 与 空间 复杂 性 度量 之 间 惊 人 的 联系 。 

与 非 确定 型 算法 一 样 ， 交 错 式 算 法 可 以 含有 把 一 个 过 程 分 支 成 多 个 子 过 程 的 指令 。 两 
者 的 区 别 在 于 决定 接受 的 方式 。 如 果 有 一 个 初始 的 过 程 接受 ， 非 确定 型 计算 就 接受 。 而 当 
一 个 交错 式 计 算 分 成 多 个 过 程 时 ， 有 两 种 可 能 : 一 种 可 能 是 ， 算 法 规定 如 果 有 一 个 子 过 程 
接受 ， 则 当前 过 程 接受 ; 男 一 种 可 能 是 ， 规 定 如 果 所 有 的 子 过 程 接受 ， 则 当前 过 程 接受 。 

用 树 表 示 产 生子 过 程 的 分 支 结构 ， 可 以 形象 地 表现 交错 式 计算 和 非 确 定型 计算 之 间 的 
区 别 。 每 一 个 顶点 表示 过 程 中 的 一 个 格局 。 在 非 确 定型 计算 中 ， 每 一 个 顶点 做 它 的 儿子 的 
OR 运算 。 这 对 应 于 通常 的 非 确定 型 接受 方式 : 只 要 有 一 个 儿子 接受 ， 该 过 程 就 接受 。 在 
交错 式 计算 中 ， 按 照 算法 的 决定 ， 顶 点 可 以 做 AND 运算 或 OR 运算 ， 这 对 应 于 交错 式 计 
算 的 接受 方式 : 如 果 所 有 的 儿子 都 接受 ， 则 该 过 程 接受 ， 或 者 如 果 有 一 个 儿子 接受 ， 则 该 
过 程 接受 。 我 们 如 下 定义 交错 式 图 灵机 。 

交错 式 图 灵机 (alternating Turing machine) 是 一 种 具有 特殊 功能 的 非 确 
定型 图 灵机 。 除 accept 和 greect 外 ， 它 的 状态 分 成 全 称 状态 (universal state) 和 存在 状态 
(existential state)。 当 对 输入 串 运 行 交错 式 图 灵机 时 ， 根据 对 应 的 格局 是 包含 全 称 状 态 还 
是 包含 存在 状态 ， 用 人 或 V 标记 它 的 非 确 定型 计算 树 的 每 一 个 顶点 。 如 果 一 个 顶点 标记 人 
且 它 的 儿子 都 接受 ， 或 者 标记 V 且 它 的 儿子 中 有 一 个 接受 ， 则 指定 这 个 顶点 接受 。 如 果 起 
始 顶 点 被 指定 为 接受 ， 则 接受 输入 。 

图 10-2 给 出 非 确 定型 计算 树 和 交错 式 计 算 树 。 交 错 式 计算 树 的 顶点 标 有 人 或 V ， 分 
别 表示 计算 儿子 的 AND 或 OR. 


10.3.1 交错 式 时 间 与 交错 式 空间 
交错 式 图 灵机 的 时 间 复 杂 性 和 空间 复杂 性 的 定义 与 非 确定 型 图 灵机 的 一 样 ， 是 每 个 计 

算 分 文 所 用 的 时 间 和 空间 的 最 大 值 。 交 错 式 时 间 复 杂 性 类 和 空间 复杂 性 类 定义 如 下 : 
ATIME(t(n))={L|L 是 被 一 台 O(li(n)) 时 间 的 交错 式 图 灵机 判定 的 语言 } 
ASPACE(f(n))={L|L 是 被 一 台 O(f(n)) 空间 的 交错 式 图 灵机 判定 的 语言 } 
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非 确定 型 
图 10-2 非 确 定型 计算 树 与 交错 式 计 算 树 


定义 AP、APSPACE 和 AL 分 别 是 多 项 式 时 间 、 多 项 式 空 间 和 对 数 空间 的 交错 式 图 灵 
机 判定 的 语言 


永 真 式 (tautology) 是 一 个 布尔 公式 ， 对 于 变量 的 每 一 个 赋值 ， 它 的 值 
都 等 于 1。 令 TAUT=((g)|g 是 一 个 永 真 式 } 。 下 述 交 错 式 算 法 表明 TAUT 在 AP 中 。 
“对 输入 <p): 
1. 全 称 地 选取 对 $ 的 变量 的 所 有 赋值 。 
2. 对 一 个 具体 的 赋值 ， 计 算 y 的 值 。 
3. MRA 的 值 为 1， 则 接受 ; 否则 拒绝 。” 
算法 的 步骤 1 用 全 称 分 支 非 确定 性 地 选取 对 $ 的 变量 的 每 一 个 赋值 。 这 样 ， 为 了 使 整 
个 计算 接受 ， 要 求 所 有 的 分 支 都 接受 。 步 又 2 和 3 确定 性 地 检查 在 一 个 具体 的 计算 分 支 中 
选取 的 赋值 是 否 满足 这 个 公式 。 因 此 ， 这 个 算法 如 果 确 认 所 有 的 赋值 都 是 满足 的 ， 则 接受 
它 的 输入 。 
注意 到 TAUT 是 coNP 的 一 个 成 员 。 事 实 上 ， 用 类 似 刚才 的 算法 ， 可 以 很 容易 地 证 明 
coNP 中 的 任何 问题 都 在 AP 中 。 s 
这 个 例子 描绘 了 AP 中 的 语言 的 特点 ， 但 不 知道 它 是 在 NP 中 还 是 在 coNP 
中 。 回 想 一 下 问题 7. 21 中 定义 的 MIN- FORMULA 语言 。 下 述 算法 表明 MIN-FORMULA 在 
AP 中 。 
“ITA Ce): 
1. 全 称 地 选取 所 有 比 6 短 的 公式 y。 
2. 存在 地 选取 对 y 的 变量 的 一 个 赋值 。 
3. 计算 g 和 y 关于 这 个 赋值 的 值 。 
4. 如 果 这 两 个 公式 的 值 不 同 ， 则 接受 ; 如 果 这 两 个 公式 的 值 相同 ， 则 拒绝 。” 
算法 开始 时 ， 在 步骤 1 用 全 称 分 支 选取 所 有 更 短 的 公式 ， 然 后 ， 在 步骤 2 转 到 存在 分 
支 选 取 一 个 赋值 。 交 错 式 一 词 源 于 在 全 称 分 支 与 存在 分 支 之 间 交 错 或 转换 的 能 力 。 s 
交错 式 使 我 们 能 够 给 出 复杂 性 的 时 间 度 量 与 空间 度量 之 间 显 著 的 联系 。 粗 略 地 说 ， 下 
述 定 理 说 明 ， 对 于 多 项 式 相关 的 界限 ， 交 错 式 时 间 与 确定 型 空间 等 价 ; 当时 间 界 限 指数 地 
多 于 空间 界限 时 ， 交 错 式 空间 与 确定 型 时 间 等 价 。 
对 于 f(n) 宇 n， 有 
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ATIME( f(n)) SC SPACE( f(n)) Z ATIME( f? (n)) 

对 于 f(n)Slogn, A 

ASPACE( f(n)) = TIME(2%F@) ) 

Kk, AL=P, AP=PSPACE 以 及 APSPACE 一 EXPTIME。 下 面 把 这 个 定理 的 证 明 
分 成 4 个 引 理 。 

对 于 fMn, A ATIME(f(n))CSPACE(f(n)). 

证 明 把 OC(f(n)) 时 间 的 交错 式 图 灵机 M 转换 成 O(f(n)) 空间 的 确定 型 图 灵机 S, 
S 如 下 模拟 M : 对 于 输入 w，S 对 M 的 计算 树 做 深度 优先 搜索 ， 确 定 哪些 顶点 接受 。 如 果 
树 根 〈 对 应 起 始 格局 ) 接受 ， 则 S 接受 。 

机 器 S 需要 空间 来 存储 在 深度 优先 搜索 中 使 用 的 递归 栈 。 递 归 的 每 一 层 存 储 一 个 格 
局 。 递 归 的 深度 是 M 的 时 间 复 杂 度 。 每 一 个 格局 使 用 O(f(n)) 空间 ，M 的 时 间 复 杂 度 为 
O(f(n)). Ak, SERO?) 空间 。 

注意 到 S 在 递归 的 每 一 层 不 需要 存储 整个 格局 ， 因 而 可 以 改进 它 的 空间 复杂 度 。 代 车 
存储 整个 格局 的 是 ， 只 记录 M 从 上 一 格局 到 这 个 格局 时 所 做 的 非 确定 型 选择 。 然 后 ， 通 
过 多 次 执行 从 头 开始 的 计算 ， 并 按照 记录 的 “路 标 ” 进 行 ，S 可 以 找到 这 个 格局 。 这 样 把 
在 递归 的 每 一 层 空间 的 使 用 减少 到 和 常数。 于是， 整个 使 用 的 空间 为 O(f(n))。 a 

对 于 fn) n, A SPACE(f(n)) CATIME( P (n)). 

证 明 ”从 一 台 O(f(n)) 空间 的 确定 型 图 灵机 M 出 发 ， 构 造 一 台 交 错 式 图 灵机 S, H 
OCf? (n)) 时 间 模 拟 它 。 方 法 类 似 于 在 萨 维 奇 定理 〈 和 定理 8.5) 的 证 明 中 使 用 的 方法 ， 在 
那里 构造 了 一 个 关于 可 产生 性 问题 的 一 般 过 程 。 

在 可 产生 性 问题 中 ， 任 给 M 的 两 个 格局 cl 、cz 和 一 个 数 :， 要 检验 M 是 否 能 在 上 步 内 
从 ci 得 到 cs 。 关 于 这 个 问题 的 交错 式 过 程 ， 首 先 存 在 地 分 支 去 猜想 cl 和 cz 之 间 的 格局 
cm 。 然 后 全 称 地 分 支 成 两 个 过 程 ， 一 个 递归 地 检验 在 t/2 步 内 cl 是 否 能 得 到 cv" ， 另 一 个 
递归 地 检验 在 /2 步 内 cm 是 否 能 得 到 c2. 

机 器 S 用 这 个 交错 式 递归 过 程 检验 起 始 格局 在 2% 裤 步 内 是 否 能 到 达 一 个 接受 格局 。 
这 里 ， 选 取 d 使 得 M 在 它 的 空间 界限 内 的 格局 数 不 超 过 27, 

该 交错 式 过 程 的 每 一 个 分 支 使 用 的 最 大 时 间 等 于 在 递归 的 每 一 步 写 一 个 格局 的 时 间 
OC(f(n)) 乘 以 递归 的 深度 logs = 二 O(f(n))。 因 此 ， 算 法 在 交错 式 时 间 OC Ca)) 内 
运行 。 | " 

TERED T f(n)Slogn, A ASPACE f(n)) CTIME(29°™ ), 

证 明 构造 一 台 2°V 时 间 的 确定 型 图 灵机 S， 模 拟 O(f(n)) 空间 的 交错 式 图 灵机 
M。 对 于 输入 w,S 构造 M tw 的 计算 图 如 下 。 顶 点 集 是 M 关于 w 的 所 有 格局 ， 每 一 顶 
点 最 多 使 用 d(f(n)) 空间 ， 这 里 ，4 是 某 个 适合 于 M 的 和 常数 因子 。 从 每 一 个 格局 到 MB 
动 一 步 所 得 到 的 格局 连 一 条 边 。 构 造 图 之 后 ，S 反复 扫描 这 个 图 ， 给 某 些 顶 点 作 接 受 的 记 
号 。 一 开始 ， 仅 给 M 真正 的 接受 格局 作 记 号 。 如 果 一 个 执行 全 称 分 文 的 格局 的 所 有 儿子 
都 有 记号 ， 则 给 它 作 记号 ; 如 果 一 个 执行 存在 分 支 的 格局 有 一 个 儿子 有 记号 ， 则 给 它 作 记 
号 。 机 器 S 连续 扫描 和 作 记 号 ， 直 到 在 一 次 扫描 中 没有 给 顶点 作 记 号 为 止 。 最 后 ， 如 有 果 M 
关于 w 的 起 始 格局 作 了 记号 ， 则 S 接受 。 

由 于 f(n) Slog n, M&F w WH BOW 200) 。 因 此 计算 图 的 大 小 为 200eo) ， 可 
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在 2° 时 间 内 构造 它 。 扫 摘 一 次 差不多 也 用 同样 的 时 间 。 因 为 除 最 后 一 次 外 ， 每 扫 
描 一 次 至 少 给 一 个 顶点 作 记 号 ， 故 扫描 的 总 次 数 不 超过 顶点 数 。 因 此 ， 使 用 的 总 时 间 为 
LOS) | A 
对 于 f(n)>Slog n, A ASPACE(f(n))DTIME (204 ), 
证 明 要 说 明 交 错 式 图 灵机 S ON FA OC f(m)) 空间 模拟 209%? 时 间 的 确定 型 图 灵机 
M。 这 个 模拟 是 有 点 难 办 的 ， 因 为 S 可 使 用 的 空间 比 
M 的 计算 长 度 要 小 很 多 。 这 里 ，S 只 有 足够 的 空间 存 
WHAM Æw 上 运行 的 画面 的 指针 ， 如 图 10- 3 所 示 。 
采用 定理 9. 25 证 明 中 给 出 的 格局 表示 法 ， 一 个 符 
号 可 以 既 表 示 机 器 的 状态 ， 又 表示 读 写 头 下 的 带 单元 的 
内 容 。 在 图 10- 3 中 ， 单 元 4 的 内 容 取决 于 它 的 父辈 a、 2 
b 和 cc 的 内 容 ( 左 、 右 边界 上 的 单元 只 有 两 个 父 华 )。 
S 递归 地 进行 ， 猜 想 并 验证 画面 中 各 个 单元 的 内 
容 。 如 果 单 元 d 不 在 第 一 行 ， 为 了 验证 单元 & 的 内 容 ， 
S 存在 地 猜想 它 的 父辈 的 内 容 。 按 照 M 的 转移 函数 ， 
验证 这 些 内 容 是 否 能 产生 d 的 内 容 。 然 后 ，S 全 称 地 |。 go Mae LEGANA 
分 文 去 递归 地 验证 这 些 猜 想 的 内 容 。 如 果 d 在 第 一 行 ， 
因为 知道 M 的 起 始 格局 ，$S 直接 地 验证 4 的 内 容 。 可 以 假设 M 在 接受 时 把 它 的 读 写 头 移 
SrA, Ak, Siw Wien mA RA ROMA, 能够 确定 M 是 否 接 受 w。 从 而 ， 
S 只 需要 存储 一 个 指向 画面 中 一 个 单元 的 指针 ， 故 使 用 的 空间 为 log2°™ =O f(n)). m 


10. 3.2 多 项 式 时 间 层 次 

交错 式 图 灵机 提供 了 一 种 手段 ， 在 PSPACE 类 中 定义 一 个 类 的 自然 层次 。 

Hit- AAR, D 交错 式 图 灵机 是 以 存在 步骤 开始 ， 在 每 一 个 输入 
和 每 一 个 计算 分 支 上 最 多 含有 i 次 全 称 步骤 与 存在 步骤 轮换 的 交错 式 图 灵机 。JI; 交错 式 图 
灵机 与 此 类 似 ， 只 是 它 以 全 称 步 骤 开 始 。 

令 Si TIME(f(n)) AS: 交错 式 图 灵机 在 OC(f(n))〉 时 间 内 可 判定 的 语言 类 。 类 似 地 ， 
对 于 开交 鲁 式 图 灵机 定义 FTIME (f(n)) 类 。 对 于 空间 界限 的 交错 式 图 灵机 定义 
ziSPACE(f(n)) 类 和 JiSPACE(f(n))。 下 述 语言 类 集合 称 作 多 项 式 时 间 层 次 (polyno- 


mial time hierarchy) : 


20Utm) 











Le = U >; TIME(?#*) 

IP = H: TIME) 
我 们 定义 类 PH= US:P=UOiP. R, NP=3iP, mH coNP=MP. Wh, MIN-FOR- 
MULA € InP. | | 


10.4 交互 式 证 明 系 统 


交互 式 证 明 系 统 提 供 了 一 种 定义 类 似 NP 的 概率 语言 类 的 手段 ， 这 很 像 多 项 式 时 间 概 
率 算法 给 出 类 似 P 的 概率 语言 类 。 交 互 式 证 明 系统 的 开发 对 复杂 性 理论 产生 了 深刻 的 影 
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啊 ， 给 密码 学 和 近似 算法 这 两 个 领域 带 来 了 重大 进展 。 为 了 体会 一 下 这 个 新 概念 ， 我 们 重 
新 对 NP 作 点 直观 的 分 析 。 

NP 中 的 语言 是 这 样 的 一 些 语 言 : 它们 的 成 员 都 有 容易 验证 的 短 的 资格 证 书 。 如 果 需 
要 的 话 ， 请 回 到 7. 3 节 ， 重 温 一 下 对 NP 的 系统 前 述 。 现 在 重新 简洁 地 描写 这 个 系统 盖 
述 ， 这 次 增添 两 个 新 东西 : 一 个 证 明 者 和 一 个 检验 者 ， 前 者 寻找 成 员 资 格 的 证 明 ， 后 者 验 
证 证 明 。 设 想 证 明 者 好 像 正 在 设法 使 检验 者 相信 w 是 A 的 成 员 。 要 求 检验 者 是 一 台 多 项 
式 时 间 界 限 的 图 灵机 ， 否 则 ， 它 自己 就 能 够 给 出 答案 。 对 证 明 者 不 加 任何 计算 界限 ， 因 为 
寻找 证 明 是 相当 耗 时 的 。 

以 SAT 问题 为 例 。 证 明 者 可 以 提供 一 个 满足 的 赋值 ， 使 多 项 式 时 间 的 检验 者 相信 公 
式 $ 是 不 可 满足 的 。 证 明 者 能 够 类 似 地 使 计算 有 限制 的 检验 者 相信 一 个 公式 是 不 可 满足 的 
吗 ? 由 于 不 知道 SAT 在 NP 中 的 补 ， 因 此 不 能 依赖 上 述 证 明 思 想 。 然 而 ， 假 如 给 证 明 者 
和 检验 者 添加 两 个 额外 的 特性 ， 令 人 惊奇 地 发 现 答案 是 肯定 的 。 首 先 ， 人 允许 它们 进行 双向 
对 话 。 其 次 ， 检验 者 可 以 是 一 台 多 项 式 时 间 的 概率 图 灵机 ， 它 以 很 大 的 把 握 (但 不 是 绝对 
的 把 握 ) 做 出 正确 的 回答 。 这 样 一 对 证 明 者 和 检验 者 构成 一 个 交互 式 证 明 系 统 。 


10.4.1 图 的 非 同 构 


我 们 用 一 个 漂亮 的 例子 一 一 图 同 构 问 题 来 前 明 交 互 式 证 明 概 念 。 如 果 能 够 重新 安排 G 

的 顶点 的 顺序 ， 使 得 它 与 互 一 样 ， 则 称 图 GSH 同 构 (isomorphic)。 令 
ISO = {(G, H) | G#4 H AAEH i K) 

虽然 ISO 显然 在 NP 中 ， 但 是 至 今 没 有 找到 这 个 问题 的 多 项 式 时 间 算 法 ， 也 没有 证 明 它 是 
NP 完全 的 。 它 是 NP 中 尚未 确定 位 置 的 、 为 数 不 多 的 自然 问题 中 的 一 个 。 

这 次 考虑 TSO 的 补 ， 即 语言 

NONISO = ((G,H) | G 和 瓦 是 两 个 不 同 构 的 图 》} 

由 于 不 知道 如 何 提供 两 个 图 不 同 构 的 短 的 证 书 ， 故 不 知道 NONISO 在 NP 中 。 然 而 ， 当 
两 个 图 不 同 构 时 ， 正 如 将 要 证 明 的 那样 ， 证 明 者 能 够 使 检验 者 相信 这 个 事实 。 

假设 有 两 个 图 Gi 和 Gzs 。 如 果 它 们 同 构 ， 证 明 者 提供 它们 的 同 构 映射 ， 即 顶点 的 重新 
排列 ， 能 够 使 检验 者 相信 这 个 事实 。 但 是 ， 如 果 它 们 不 同 构 ， 证 明 者 怎么 使 检验 者 相信 
呢 ? 不 要 忘记 : 检验 者 不 一 定 相 信 证 明 者 ， 因 此 对 于 证 明 者 来 说 ， 仅 仅 说 它们 不 同 构 是 不 
够 的 。 证 明 者 必须 使 检验 者 信服 才 行 。 考 虑 下 述 简短 的 协议 。 

检验 者 随机 地 选择 G 或 Gz ， 随 机 地 重新 排列 它 的 顶点 ， 得 到 图 AH. RRA AK 
给 证 明 者 ， 证 明 者 必须 回答 H Eh G 还 是 由 G2 得 到 的 。 这 就 是 整个 协议 。 

如 果 Cl 和 Gz 确实 不 同 构 ， 证 明 者 总 能 够 执行 协议 ， 因 为 它 能 够 区 分 五 ÆRA G 还 
是 来 自 Gs 。 但 是 ， 如 果 两 个 图 同 构 ， 则 H 可 能 来 自 G1， 也 可 能 来 自 G;。 因 而 即使 不 限 
制 计算 能 力 ， 证 明 者 给 出 正确 回答 的 机 会 也 不 会 好 于 一 半 对 一 半 。 于 是 ， 如 果 证 明 者 能 够 
始终 如 一 地 正确 回答 (例如 ， 重 复 100 次 协议 )， 则 检验 者 获得 两 个 图 确实 不 同 构 的 令 人 
信服 的 证 据 。 


10. 4.2 模型 的 定义 


为 了 形式 地 定义 交互 式 证 明 系 统 模型 ， 描 述 检验 者 、 证 明 者 以 及 它们 的 相互 作用 。 我 
们 会 发 现 ， 记 住 图 的 非 同 构 这 个 例子 是 有 用 的 。 定 义 检验 者 〈Verifier) 是 一 个 函数 V， 
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它 根 据 至 今 传递 的 信息 历史 ， 计 算 下 一 次 传送 给 证 明 者 的 信息 。 邑 数 V 有 3 个 输入 : 

1. 输入 串 。 我 们 的 目标 是 确定 这 个 字符 串 是 否 是 某 个 语言 的 成 员 。 在 NONISO 例子 
中 ， 输 入 串 是 两 个 图 的 编码 。 

2. 随机 输入 。 为 了 便于 给 出 定义 ， 给 检验 者 提供 一 个 随机 选取 的 输入 串 ， 用 来 代替 
在 计算 中 做 概率 动作 的 能 力 。 两 者 是 等 价 的 。 

3. 部 分 信息 历史 。 函 数 不 能 存储 已 进行 过 的 对 话 。 因 此 ， 通 过 用 一 个 字符 串 表 示 到 
现在 为 止 交换 的 信息 来 提供 额外 的 存储 能 力 。 用 记号 mi tome He Hm: 表示 交换 信息 
mi°***™M; o 
检验 者 的 输出 或 者 是 序列 中 的 下 一 个 信息 m;+1， 或 者 是 指明 交互 作用 的 结果 : 接受 
或 拒绝 。 于 是 V 的 函数 形式 为 了 :3* X53* X53* 一 >5* U{( 接 受 , 拒 绝 )。 

Vl(w,r,mi 划 "…##mi) 二 mi+1 表 示 输 入 串 为 w， 随 机 输入 为 +r， 当前 的 信息 历史 为 mi 
到 Mi s 以 及 检验 者 给 证 明 者 的 下 一 个 信息 为 Mi+1 o 

证 明 者 (Prover) 的 计算 能 力 是 无 限 的 。 和 定义 它 为 一 个 函数 已 ， 有 两 个 输入 : 

1. 输入 串 。 

2. 部 分 信息 历史 。 

证 明 者 的 输出 是 给 检验 者 的 下 一 个 信息 。 形 式 地 ， 的 形式 为 P:3* X>*—>d". 

PCw,m, # + # m) =m RANE VRB meom 之 后 ， 证 明 者 把 mi;+1 送 给 检 
验 者 。 

现在 定义 证 明 者 和 检验 者 之 间 的 交互 作用 。 对 于 给 定 的 字符 串 w 和 x， 如 果 存 在 信息 
序列 ml ，… ,ma ， 使 得 

1. 40Ni<k Hi 为 偶数 时 ，VCwyrymal H° #mi:)=mi+1; 

2. 40<i<k Hi HARA, PCw.m He 4m) =mi41; 

3. 该 信息 历史 中 的 最 后 一 个 信息 m 是 接受 。 

则 记 作 (VP)(w,r) 二 接受 。 

为 了 简化 IP 类 的 定义 ,假设 检验 者 的 随机 输入 和 检验 者 与 证 明 者 之 间 交 换 的 每 一 个 
信息 的 长 度 都 是 p(n)， 这 里 p 是 仅 与 检验 者 有 关 的 多 项 式 。 此 外 ， 还 假设 交换 的 信息 总 
数 不 超 过 p(n)。 下 述 定义 给 出 交互 式 证 明 系 统 接受 输入 串 w 的 概率 。 对 于 任意 长 度 为 n 
的 字符 串 w， 定 义 

Pr[V<>P 接受 ww] = Pr[ (VP) (wr) = #2] 
其 中 r 是 随机 选取 的 长 度 为 p(n) 的 字符 串 。 

如 果 存 在 一 个 多 项 式 时 间 可 计算 函数 V， 使 得 对 任意 函数 P、 函 数 

和 字符 串 w, 


1.wEA #%% Pr[VeP HE w]> 


2 
= 
2 wA RA PriVoP #E w]<+ 
则 说 语言 A 在 IP 中 。 

换 句 话说 ， 如 果 wEA， 则 某 个 证 明 者 P (一 个 “诚实 的 ”证 明 者 ) 能 使 检验 者 以 高 
概率 接受 ; 但 如 果 w# A， 则 没有 证 明 者 (一 个 “不 诚实 的 ”证 明 者 P) 能 够 使 检验 者 以 
高 概率 接受 。 
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可 以 像 在 引 理 10. 5 中 使 错误 概率 指数 地 小 那样 ， 通 过 反复 运行 ， 放 大 交互 式 证 明 系 
统 的 成 功 概 率 。 显 然 ，IP 包含 NP 类 和 BPP 类 ， 我 们 还 证 明了 它 包 括 语言 NONISO, 但 
不 知道 NONISO 在 NP 还 是 BPP 中 。 下 面 将 要 证 明 ，IP 类 出 人 意料 地 大 ， 它 等 于 
PSPACE 类 ， 


10.4.3 IP=PSPACE 


本 节 证 明 复 杂 性 理论 中 一 个 著名 的 定理 : IP 类 与 PSPACE RMS. TH, WT 
PSPACE 中 的 任 一 语言 ， 证 明 者 能 够 使 多 项 式 时 间 的 概率 检验 者 相信 该 语言 中 字符 串 的 成 
员 资 格 ， 而 这 种 成 员 资格 的 常规 证 明 可 能 是 指数 长 的 。 

IP=PSPACE, 

把 这 个 定理 分 解 成 两 个 引 理 ， 分 别 给 出 一 个 方向 的 包含 关系 。 第 一 个 引 理 证 明 IPC 
PSPACE。 虽 然 有 一 点 技巧 ， 但 是 这 个 引 理 的 证 明 是 用 多 项 式 空 间 的 机 需 对 交互 式 证 明 系 
统 的 一 般 模拟 。 

IPCPSPACE。 

证 明 设 A 是 IP 中 的 一 个 语言 。 假 设 当 输入 w 的 长 度 为 n 时，A 的 检验 者 V 恰好 交 
ti p=p(n) 个 信息 。 构 造 一 台 模 拟 V 的 PSPACE 机 器 M。 首 先 ， 对 任意 的 字符 串 w 定义 

Pr| V 接受 w| = max Pr[V<>P Æ% w] 


Y wEA PM, RXMEDSF, YwREA H, ESSE. FEA 


在 多 项 式 空 间 内 计算 这 个 值 。 用 Mj; 表示 信息 历史 mi #e#m. V 与 P 交互 作用 的 定 
义 推广 到 从 任意 信息 流 M; 开始 。 如 果 能 够 用 信息 mj+1，… ,mz 扩充 Mi ， 使 得 

1. 当 0 二 i 二 p Hi AKAN, VCw.r,m H° #m:)=mi+1; 

2. 当 j 二 i 二 pp Hi HTAA, Plw.m 井 … # m:i) =mi+; 

3. 该 信息 历史 中 最 后 一 个 信息 mp 是 接受 。 
则 记 作 〈(Ve>P)(W,r, Mi ) 王 接受 。 

注意 ， 这 些 条 件 要 求 V 的 信息 和 Mj; 中 已 经 存在 的 信息 保持 一 致 。 进 一 步 推广 早先 给 
出 的 几 个 定义 。 对 于 长 度 为 p 的 随机 串 r+， 定 义 

PrL 从 M; 开始 VeeP 接受 包 ] = Pr-L (VP) (w,r,M;) = 接受 ] 
这 里 ， 为 了 以 后 证 明 的 需要 ， 我 们 引入 符号 Pr-， 它 表示 概率 是 考虑 所 有 和 Mi 上 信息 一 
致 的 串 r+ 上 的 概率 。 如 果 不 存在 这 样 的 >， 则 定义 概率 为 0。 然后 定义 
PrL 从 M; 开始 V Èw] = max PrL 从 Mi 开始 Ve>P HX w | 

对 每 一 个 0<j 二 p 和 每 一 个 信息 流 M;， 从 j 三 p 开始 递减 ;}， 对 Nm 进行 归纳 定义 。 
对 包含 p 个 信息 的 信息 流 M。， 如 果 对 一 些 串 +，M。 AV 的 信息 一 致 并 且 m S=, 
& Nu 一 1. Bl, & Nu, =0. 

对 j 二 p 和 一 个 信息 流 Mj;， 如 下 定义 Nm 。 

maxm ,, Nw,,, 若 j 二 pp 且 为 奇数 
ioe = tee avgm,, NM,， #I< PHA 

这 里 wt-avgm,, Nm, RIR Xm, (Pre LV(wsr,Mj)=mjtil > Nu,» RF Pr 表示 在 长 度 
Ap 的 随机 串 > 上 取 到 的 概率 。 这 是 Nm ,以 检验 者 传送 信息 mj+i 的 概率 为 权重 的 平 
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均值 。 

& Mo 是 空 信息 流 。 下 面 给 出 关于 Nm 的 两 个 断言 。 首 先 ， 能 够 在 多 项 式 空间 内 计算 
Nm, 。 对 于 每 一 个 和 Mi ， 算 法 递归 地 计算 Nm 的 值 。 计 算 max, 是 很 直接 的 。 为 计算 
wt-avgm,,， 我 们 需要 遍历 所 有 长 度 为 p 的 串 +， 删除 那 些 使 得 检验 者 产生 与 Mi 中 的 信息 
不 一 致 输出 的 串 。 如 果 所 有 的 串 7 都 被 删除 了 ， 那 么 wt-avgm，, 二 0。 如 果 有 些 串 保留 下 
来 ,我们 确定 使 检验 者 输出 mj +i 的 那 部 分 串 ， 然 后 通过 计算 该 部 分 的 均值 来 确定 Nw ， 
的 权重 。 递 归 的 深度 为 p， 故 只 需要 多 项 式 空间 ，。 

其 次 ，Nw 等 于 Pr[V 接受 w]。 为 了 确定 w 是 否 在 A 中 需要 这 个 值 ， 下 面 用 归纳 法 
证 明 第 二 个 断言 。 a 

对 于 每 一 个 0<jp 和 Mj， 

Nm, = Pr[ 从 Mi 开始 V 接受 ww] 

对 7 作 归 纳 证 明 。 归 纳 基础 是 j= 二 p， 归 纳 从 p 到 0 逐步 进行 。 

归纳 基础 : 首先 证 明 j= p 时 断言 成 立 。mp 是 接受 或 者 拒绝 。 如 果 mm 是 接受 ， 则 
Nm 定义 为 1。 此 时 ， 由 于 信息 流 已 经 表明 接受 ， 故 Pr[ 从 Mi 开始 V 接受 让 ] 王 1。 因 此 ， 
断言 为 真 。 当 mp 是 拒绝 时 ， 与 此 类 似 。 

归纳 步骤 : 假设 对 于 ;十 1 三 p 和 任意 的 信息 流 Mj;+1 断言 为 真 。 要 证 明 断 言 对 j 和 任 
意 的 信息 流 M; 也 为 真 。 如 果 j 是 偶数 ， 则 mE VIA P 的 信息 。 于 是 有 


1 
Nm, = >) Pr, [V(w,r,M;) = mjn] + Nm, ) 


mM i+] 


l 2 (Pr-LV(w,r,Mj) = mile PrLA Mjn 开始 V BR w)) 

= Pr[ 从 M; 开始 V EK w] 
等 式 1 是 Nm 的 定义 。 根 据 归 纳 假设 有 等 式 2。 等 式 3 由 PrL 从 Mi 开始 V 接受 wj] 的 定义 
得 到 。 因 而 ， 当 7 是 偶数 时 ， 断 言 成 立 。 如 果 ;7 是 奇数 ， 则 m; +1 是 PP 传 给 V 的 信息 。 于 
是 有 


1 
Nm, = max Nm,,, 


mati 


=max PrL 从 Mjn 开始 V 接受 wj] 
=Pr[ 从 M; 开始 V 接受 名 ] 
等 式 1 是 Nm 的 定义 。 等 式 2 使 用 归纳 假设 。 我 们 把 等 式 3 分 成 两 个 不 等 式 。 由 于 使 下 限 
最 大 的 证 明 者 能 够 送出 使 上 限 最 大 的 信息 mj;+1， 故 有 三 。 又 由 于 这 个 证 明 者 不 可 能 送出 
比 这 个 mj+1 更 好 的 信息 ， 故 有 宇 。 送 出 任何 不 使 上 限 最 大 的 信息 都 会 使 最 后 得 到 的 值 变 
小 。 这 就 证 明 当 j 为 奇数 时 断言 也 成 立 ， 从 而 完成 定理 10. 26 的 一 个 方向 的 证 明 。 = 
现在 证 明 该 定理 的 另 一 个 方向 。 这 个 引 理 的 证 明 引 入 一 个 新 的 分 析 计 算 的 代数 方法 。 
PSPACECIP, 
在 证 明 这 个 引 理 之 前 ， 我 们 先 证 明 一 个 较 弱 的 结果 ， 用 来 说 明 这 个 新 技术 。 可 满足 性 
的 计数 问题 定义 为 语言 
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# SAT = ((4$,k〉| p 是 恰好 有 个 满足 赋值 的 合 取 范 式 } 
+ SATEIP, 
证 明 思 路 ”该 证 明 描述 一 个 协议 ， 按 照 这 个 协议 ， 证 明 者 使 检验 者 相信 : k 确实 是 给 
定 的 合 取 范 式 y 的 满足 赋值 的 个 数 。 在 给 出 这 个 协议 之 前 ， 先 考虑 另 一 个 协议 。 它 具有 一 
般 协 议 的 某 种 风格 ， 但 由 于 需要 指数 时 间 的 检验 者 ， 因 而 是 不 能 令 人 满意 的 。 设 $ 有 变量 
Ee gl ole 
对 于 0 二 ?mm， 定 义 函 数 fi WF: MF ais,a:€{0,1}, + fi(al1,…,ai) 等 于 的 
满足 条 件 rja WR EREKTA. PRR fo() 是 y 的 满足 赋值 的 个 数 。 如 果 
ars sai WES, W fm (al,…,am) 等 于 1; 否则 等 于 0。 显 然 ， 对 每 一 个 i<m Aas 
Ais 有 
Fi Cay see Qi) = fii Car 9*** 9550) + fi Cals sai ,1) 
关于 #SAT 的 协议 ， 从 阶段 0 开始 到 阶段 m 十 1 结束 。 输 入 是 有 序 对 (4,k&)。 
阶段 0 PHO ERV. 
V 检查 二 fo()。 如 果 不 相等 ， 则 VV 拒绝 。 
阶段 1 PP 把 f1(0) MANAA) 传送 给 V。 
V 检查 foO=fAi(O+fid), WEFTA., WV 拒绝 。 
阶段 2 PP 把 f2(0,0)，f2(0,1)，f2z(1,0) 和 fz(1,1) 传送 给 V。 
V 检查 f1(0)=f2(0,0) + f2(0,1) 和 有 (1)==f2(1,0) 十 f2(1,1)。 
如 果 有 一 个 不 相等 ， 则 V 拒绝 。 


阶段 m XF ai 的 每 一 个 赋值 ，P 把 fm (al,… ,am) 传送 给 V。 

V 检查 2”-! 个 联系 fmi 5 fm 的 等 式 。 如 果 有 一 个 不 相等 ， 则 V 拒绝 。 

阶段 m 十 1 对 于 a; 的 每 一 个 赋值 ，V 通过 计算 关于 这 个 赋值 的 值 来 检查 falas, 
am) 的 值 是 否 正 确 。 如 果 对 于 所 有 的 赋值 都 正确 ， 则 V 接受 ; 否则 拒绝 。 协 议 的 描述 
完毕 。 

由 于 检验 者 必须 花 指 数 时 间 读 证 明 者 传送 给 它 的 指数 长 的 信息 ， 该 协议 没有 提供 
# SATE IP 中 的 证 明 。 尽 管 如 此 ， 现 在 我 们 来 检查 它 的 正确 性 ， 因 为 这 可 以 帮助 我 们 理 
解 下 面 的 更 有 效 的 协议 。 

凭 直觉， 如果 证 明 者 能 够 使 检验 者 相信 A 中 字符 串 的 成 员 资格 ， 则 协议 判定 语言 A 
换 名 话说， 如果 字 符 串 是 A 的 成 员 ， 则 有 一 个 证 明 者 能 够 使 检验 者 以 大 概率 接受 。 如 果 该 
字符 串 不 是 A 的 成 员 ， 则 没有 证 明 者 一 一 即使 是 不 诚实 的 或 狭 独 的 一 一 能 够 使 检验 者 接受 
的 概率 大 于 一 个 较 小 的 数值 。 用 符号 P 表示 正确 地 执行 协议 的 证 明 者 。 当 输入 在 A 中 时 ， 
它 使 V 以 大 概率 接受 。 用 巨 表 示 当 输入 不 在 A 中 时 任何 与 检验 者 相互 作用 的 证 明 者 。 把 
P 看 成 一 个 对 手 ， 当 V 应 该 拒绝 时 ，P 好 像 正在 企图 让 V 接受 。 记 号 P 暗示 这 是 一 
“不 诚实 的 ”证 明 者 。 

在 刚刚 描述 的 # SAT 协议 中 ， 检 验 者 不 考虑 它 的 随机 输入 。 只 要 选 定 了 证 明 者 ， 它 
的 运行 就 是 完全 确定 的 。 因 而 ， 为 了 证 明 协 议 正确 ， 我 们 证 明 如 下 两 点 事实 。 首 先 ， 如 果 
ERA (pk) P k ERE g 的 满足 赋值 的 个 数 ， 则 有 某 个 证 明 者 P 能 使 V 接受 ; 在 每 一 


阶段 中 ， 给 予 正确 响应 的 证 明 者 都 是 这 么 做 的 。 第 二 ， 如 果 上 不 正确 ， 则 每 一 个 证 明 者 P 


都 会 使 V 拒绝 。 下 面 证 明 第 二 种 情况 。 

如 果 到 不 对 ， 并 且 巨 给 出 了 准确 的 响应 ， 则 由 于 fo() 是 $ 的 满足 赋值 的 个 数 并 且 
FOR, Ati V 在 阶段 0 就 马上 拒绝 。 为 了 阻止 V 在 阶段 0 拒绝 ，P 必须 违背 协议 传送 
一 个 错误 的 foO E, WEO., PRH, PO 是 关于 PO 值 的 一 个 谎言 。 和 现实 生 
活 中 一 样 ， 谎 言 引出 谎言 。 为 了 在 后 面 的 阶段 不 被 惟 穿 ， 巨 不 得 不 继续 对 其 他 的 f; 值 说 
H. DASHES MP 一 道 最 终 将 在 阶段 m 十 1 ERF, EIRE V 直接 验证 fm 的 值 。 


更 精确 地 说 ， 因 为 fo 〇 关 fo (Oy,，P 在 阶段 1 送出 的 值 NO) MAG) 中 至 少 有 一 个 
是 不 正确 的 ; TBU, V 在 检查 是 否 Fo 0) 三 万 (0) 十 广 (1) 时 拒绝 。 例 如 AO) WEDE 


确 ， 记 送出 的 值 为 广 (0) 。 如 此 继续 下 去 ， 可 以 发 现在 每 一 个 阶段 ， 一 定 要 送出 某 个 不 
正确 的 值 f; (al ,… ,a;)， 否 则 V 就 会 拒绝 。 但 是 ， 当 V 在 阶段 m 十 1 检查 那个 不 正确 的 值 
所 (a1,…,am) 时， 无 论 怎 样 它 都 会 拒绝 。 于 是 ， 我 们 得 出 结论 ， 如 果 上 大 是 不 正确 的 ， 则 


Rit P 怎么 做 ，V 都 拒绝 。 因 此 ， 该 协议 是 正确 的 。 
这 个 协议 的 问题 是 信息 的 数目 在 每 个 阶段 加 倍 地 增长 。 加 倍 的 原因 是 检验 者 为 了 确认 
一 个 值 fi(…) 需要 两 个 值 fi+1C(…,0) 和 广 +1(0…,1)。 如 果 能 找到 一 种 方法 ， 使 得 检验 
者 在 确认 一 个 fi 值 时 只 使 用 一 个 fi+1 值 ， 那 么 信息 的 数目 就 一 点 也 不 会 增加 。 采 用 下 述 
办 法 能 够 做 到 这 一 点 : 把 函数 f; 的 输入 扩大 到 非 布尔 值 ， 并 且 对 从 一 个 有 限 域 中 随机 选 
取 的 过 确认 一 个 值 Sirla 
证 明 设 上 是 变量 zl 到 zw 的 合 取 范 式 。 采 用 算术 化 〈arithmetization) 技术 ， 把 ¢ 
关联 到 一 个 多 项 式 p (zi,… ,zm)，p 模仿 $， 用 算术 运算 十 和 XX 模拟 布尔 运算 人 、V 和 一 。 
WP ATA, wa 和 8B 是 两 个 子 公 式 ， 把 表达 式 
ene 替换 成 ap 
Tg 蔡 换 成 l—@2 
a VB 替换 成 w= i—i (lO— 
观察 发 现 ，p 的 变量 的 次 数 都 不 大 ， 这 一 点 在 后 面 是 重要 的 。 运 算 ap Max PERM 
多 项 式 的 次 数 不 超 过 关于 a 和 有 8 的 多 项 式 的 次 数 之 和 。 因 而 ， 任 何 变量 的 次 数 不 超过 n, 
这 里 n 是 8 的 长 度 。 
如 果 给 p 的 变量 赋 布 尔 值 ， 则 p 和 在 该 赋值 上 得 到 的 结果 一 样 。 当 变量 取 非 布尔 值 
时 ， 不 能 用 $ 对 计算 p 做 出 明显 的 解释 。 然 而 ， 不 管 怎样 ， 在 这 个 证 明 中 要 使 用 这 样 的 赋 
值 来 分 析 64， 这 很 像 在 定理 10. 12 的 证 明 中 用 非 布尔 赋值 分 析 只 读 一 次 的 分 文 程序 。 变 量 
在 gq 个 元 素 的 有 限 域 下 上 取 值 ， 这 里 g 不 小 于 2". 
用 了 重新 定义 函数 f;， 在 证 明 思路 中 曾 定义 过 它们 。 对 于 0 三 im A asai EF, 令 
fila pmpa) = p? play 9°** 5Am) 


a; 99a, € {051} 
注意 到 这 个 新 定义 是 原 有 定义 的 推广 ， 当 所 有 a RA, WH. FÆ, PO 仍 
是 p 的 满足 赋值 的 个 数 。 每 一 个 函数 filistri) 可 表示 zl 到 zi 的 多 项 式 。 这 些 多 项 
式 的 次 数 不 超 过 p 的 次 数 。 

下 面 给 出 关于 # SAT 的 协议 。 一 开始 V RRA k HEARE %， 得 到 多 项 式 
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pP。 所 有 的 算术 运算 在 域 玉 上 进行 ， 参 与 算术 运算 的 至 多 有 gq 个 不 同 的 元 素 。 其 中 ，g 是 大 
Fa 的 素数 。( 找 到 这 样 一 个 满足 条 件 的 g 需要 一 个 附加 的 步 绝 。 我 们 暂时 忽略 这 一 点 ， 
因为 马上 将 要 给 出 的 证 明 是 一 个 更 强 的 结果 ， 即 IP 二 PSPACE， 它 不 需要 这 一 点 。) WUE 
方 括号 内 的 注释 放 在 描述 每 一 个 阶段 的 开始 。 


阶段 0 [PPK foO.] 

P>V: PP 把 fo() 传送 给 V。 

V 检查 & 三 fO., WRABER, M V 拒绝 。 

阶段 1 [PP 使 V 相信 : MRA) BERN, WhO 是 正确 的 。] 

P+V: PZA) 作为 z 的 多 项 式 的 全 部 系数 。 

V 利用 这 些 系数 计算 f1(0) 和 fi). 

V 检查 Fo() 三 亡 (0) 十 万 (1) 是 否 成 立 。 若 不 成 立 ， 则 拒绝 。 GE: 所 有 计算 都 在 


域 天 上 进行 。) 


绝 。 


V—>P: V 从 三 中 随机 地 选取 一 个 数 r1， 并 且 把 它 传 送 给 P. 

阶段 2 [P 使 V 相信 : WR feCriore) 是 正确 的 ， 则 A0) 是 正确 的 。 
PV: P 传送 f(ri,z) 作为 z 的 多 项 式 的 全 部 系数 。 

V 利用 这 些 系数 计算 f(ri,0) 和 f2(ri,1)。 

V 检查 fir =fe(n .Ot+fe(n,1) 是 否 成 立 。 大 不 成 立 ， 则 拒绝 。 
V>P: 双 从 大 中 随机 地 选取 一 个 元 素 ~* 并 且 把 它 传送 给 P. 


阶段 i [PV fa: 如 果 fino) 是 正确 的 ， 则 fi-i(no 7-1) 是 正确 的 ,| 
P>V: PfEKFiCrissri-15z) 作为 z 的 多 项 式 的 全 部 系数 。 

V 使 用 这 些 系 数 计 算 fi(riy*… ri-1,0) M filr se ,ri-1 ,1)。 
Vf 是 否 成 立 。 大 不 成 
则 拒绝 。 

V>P: V 从 三 中 随机 地 选取 一 个 数 r;， 并 且 把 它 传 送 给 P. 


阶段 m 十 1 [V 直接 验证 fw《ri,…,rm) 是 正确 的 。] 

V WË psom) FFAS fm 《ri,…,rm) 比较 。 如 果 两 者 相等 ， 则 V 接受 ; AME 
协议 的 描述 完毕 。 

下 面 证 明 这 个 协议 识别 # SAT。 首 先 ， 当 上 有 个 满足 赋值 时 ， 如 果 证 明 者 P RH 


议 办 事 ， 则 V 显然 一 定 接受 。 其 次 ， 要 证 明 当 的 满足 赋值 的 个 数 不 是 & 时 ， 没 有 证 明 者 
能 够 使 V 接受 的 概率 大 于 一 个 很 小 的 值 。 令 P 是 任意 的 证 明 者 。 


为 了 阻止 立马 上 拒绝 ,五 在 阶段 0 必须 为 fo() 传送 一 个 不 正确 的 值 fo()。 因 此 ， 在 


z 的 多 项 式 系数 一 定 是 错 的 。 把 这 些 系 数 表示 的 函数 记 作 方 (z)。 下 面 是 证 明 中 的 关键 
步 又。 


时 ， 


当 V 在 下 中 取 一 个 随机 数 ri 时 ， 可 以 断言 (rm) 不 大 可 能 等 于 fira). 4 n S10 
我 们 可 以 证 明 


Pri fi Cr) = fin) ] < n 
这 个 概率 的 上 界 来 自 引 理 10.13: 次 数 不 大 于 4 的 一 元 多 项 式 最 多 有 4d 个 根 ， 除 非 它 
恒 等 于 0。 因 此 任何 两 个 次 数 不 大 于 d 的 一 元 多 项 式 最 多 在 4 个 地 方 相 等 ， 除 非 它 们 处 处 
相等 。 


回忆 一 下 关于 fi 的 多 项 式 的 次 数 不 大 于 n， 并 且 如 果 PP 传送 的 关于 方 的 多 项 式 的 次 
数 大 于 n， 则 VV 拒绝。 已 经 肯定 这 两 个 多 项 式 不 处 处 相等 。 因 而 根据 引 理 10.13， 它 们 最 
多 在 个 地 方 相 等 。 丰 的 大 小 大 于 2". n 正好 使 它们 相等 的 机 会 不 超过 n/2", 4 n>10 
时 ， 这 个 值 不 大 于 n-?。 

再 扼要 地 重 述 一 下 至 此 所 证 明 的 东西 。 如 果 fo() 是 错 的 ， 则 方 的 多 项 式 一 定 是 错 的 ， 
从 而 根据 前 面 的 断言 ， 户 (~: ) 大概 也 是 错 的 。 如 果 出 现 可 能 性 很 小 的 事件 用 (ri1)〉 等 于 


fir), P 在 阶段 1“ 很 走运 ?， 那 么 它 在 协议 的 剩余 部 分 按照 关于 P 的 指令 执行 ， 能 够 
使 V 接受 (虽然 V 应 该 拒绝 )。 


继续 证 明 。 an fi Cr) 是 错 的 ,，V 在 阶段 2 计算 的 folri,0) 和 f(ri,1) P, BY 
有 一 个 是 错 的 ， 因 而 已 传送 的 fz (ri ,zx) 作为 z 的 多 项 式 系 数 一 定 是 错 的 。 把 这 些 系数 表 
示 的 函数 记 作 fz (ri,z)。 多 项 式 forse) 和 fz (ri,z) 的 次 数 不 大 于 n， 从 而 和 前 面 一 样 ， 
它们 在 下 中 随机 数 ro 处 相等 的 概率 小 于 n-?。 于 是 ， 当 V 随机 地 选取 rs 时 ，fz Cri sr) 
多 半 是 错 的 。 

一 般 来 讲 ， 如 此 进行 可 以 证 明 对 于 每 一 个 li<m, GR 


fia (i 9 aad Se Sea OT oor 
则 当 ”之 10 时 ， 对 于 在 大 中 随机 选取 的 ri, 
Pr[ fi(rn 7i ) 一 FiA jo) | < n~’ 

于 是 ， 由 于 对 fo (3 给 出 不 正确 的 值 ， P 大 概要 被 迫 对 fi (ri) fa (ri » Fads — 
fm (ri,…,rm) 给 出 不 正确 的 值 。 碰 巧 可 能 在 某 个 阶段 i， 虽然 fi 和 方 不 同 ， 但 是 V 选取 
的 7 ti f(r ee ry Fi Rri y*** TE Dic P 磁 上 这 种 好 运 的 概率 为 阶段 数 m HE LI n * 3 不 超 
过 1/n。 如 果 P 一 直 不 走运 ， 它 最 后 要 传送 一 个 不 正确 的 fn(rio orm) fA. mV 在 阶段 
m 十 1 直接 验证 f 的 这 个 值 ， 这 时 任何 错误 都 将 会 被 发 现 。 因 此 ， 如 果 上 不 等 于 5 的 满足 
赋值 的 个 数 ， 则 任何 证 明 者 都 不 能 使 检验 者 接受 的 概率 大 于 1/n。 

为 了 完成 定理 的 证 明 ， 还 需 证 明 检 验 者 在 概率 多 项 式 时 间 内 运行 。 根 据 对 它 的 描述 ， 
这 是 显然 的 。 7 

下 面 回 到 引 理 10. 29 PSPACECIP 的 证 明 。 类 似 上 述 定 理 10. 30 的 证 明 ， 只 是 在 这 里 
要 使 用 一 个 新 的 思想 ， 用 来 降低 协议 中 出 现 的 多 项 式 的 次 数 。 

证 明 思 路 ” 先 试 一 下 在 上 述 证 明 中 采用 的 思想 ， 从 而 找到 困难 在 什么 地 方 。 为 了 证 明 
PSPACE 中 的 每 一 个 语言 都 在 IP 中 ， 只 需 证 明 PSPACE 完全 语言 TQBF 在 IP 中 。 设 yy 
是 一 个 带 量 词 的 布尔 公式 

p = QrQ rT2 QnrmL$ 
HH 是 一 个 合 取 范式 ， 每 一 个 Q; 是 3 或 y。 函 数 f; 的 定义 和 前 面 一 样 ， 只 是 这 次 要 把 
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量词 考虑 进来 。 对 于 0 委 ;i 委 Ma ssam E {0,1}, + 
ls E Qui zii*Qnrml gai »***,ai)] AE 
0, 否则 
HEP, laissai) 是 在 上 中 把 ai .ai RA ris ci. TÆ, fO 是 yy 的 真 假 值 。 下 
述 算术 恒等式 成 立 : 
当 Qi = V fi Car oct? ai) = fin Car stt 5450) © fi Cai stt ,ai,1) 
4 Q = JW. fi Car stydi) = fits Car sys 50) * firr Cai ss a; 51) 
HZ- Fe x *¥y=1—-C—2z)—y). 

模仿 #SAT 协议 的 做 法 ， 把 所 有 fi 扩张 到 一 个 有 限 域 上 ， 并 且 对 量词 使 用 这 些 等 式 ， 
而 不 是 对 加 法 运算 使 用 等 式 。 这 个 想法 的 问题 出 在 算术 化 时 每 一 个 量词 可 能 使 产生 的 多 项 
式 的 次 数 加 倍 ， 从 而 这 些 多 项 式 的 次 数 可 能 指数 地 增长 。 这 样 一 来 ， 证 明 者 为 了 摘 述 这 些 
多 项 式 ， 必 须 传送 指数 多 个 系数 ， 进 而 检验 者 必须 运行 指数 时 间 来 处 理 这 么 多 系数 。 

为 了 保持 多 项 式 的 系数 较 少 ， 引 入 化 简 运 算 R， 它 能 降低 多 项 式 的 次 数 而 不 改变 它们 
对 布尔 输入 的 性 状 。 

证 明 设 y 二 Qzi…QzmL$」 是 带 量词 的 布尔 公式 ， 其 中 # 是 一 个 合 取 范式 。 为 了 算 
术 化 Jy， 引 入 下 述 表达 式 

p = Qrı Rr: Qr: Rrı Rx2Qr3Rx1 Rr2Rx3°QrmRx1° Rem 9] 
暂且 不 管 Rr 的 含义 ， 它 只 在 定义 函数 f; 时 有 用 。 把 y 重 新 写成 
p = SiyiS2yo°Seyel 9] 
其 市 每 一 小 S761 Vs JR} Slats Tels 
对 于 每 一 个 i 和 和 &， 定 义 图 数 Sfi 如下。fi (zi1，… ,xm) 为 算术 化 上 得 到 的 多 项 式 plas, 
Sn MY the 用 玉生 基态 
Y Sar = V Wa filer} = firl 0) « farti); 
S Sm = 3 Wo fel) = fin 0 * fa GD: 
当 Sai = R Wf: Csa) = (1 —a) fail 0) t+afiniC,1). 

如 果 Si+1 是 YV 或 3， 则 f; 比 fi+i 少 一 个 输入 变量 。 如 果 Si+1 是 R， 则 这 两 个 函数 的 
输入 变量 的 个 数 相 同 。 因 此 ， 一 般 来 讲 ， 了 艺 数 f; 将 不 依赖 于 i TER. AHR RM, 
用 “…” 代 替 asa, Hj 是 一 个 适当 的 值 。 此 外 ， 重 新 排列 这 些 函 数 的 输入 顺序 ， 
使 得 y;+1 是 最 后 一 个 输入 变量 。 

注意 ， 当 输入 是 布尔 值 时 ， 对 多 项 式 作 Re 运算 不 改变 它们 的 值 。 因 此 ，fo() 仍 是 y 
的 真 假 值 。 但 是 ， 注 意 到 Rr 运算 产生 的 结果 关于 x ERE., Æg, W Rzi Re; 添加 
在 Qiz; 的 后 面 ， 是 为 了 在 算术 化 Q 导致 变量 次 数 加 倍 之 前 把 每 一 个 变量 的 次 数 都 减少 为 1。 

现在 已 为 描述 协议 做 好 了 准备 。 本 协议 中 的 所 有 算术 运算 都 在 一 个 元 素 个 数 不 少 于 至 
NA ok EAT, HF n BY DRE. 自己 能 够 找到 一 个 这 么 大 的 素数 ， 因 而 不 需要 
P 提供 。 

阶段 0 LP 传送 fo( ).] 

P>V: PP 把 fo() 传送 给 V。 

V 验证 foO=1,. WR fFOOFAl, M V 拒绝 。 


fi Cay s**t 5; ) are 
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阶段 ; [PEV 相信 :如 果 fi(ri,…,r) 是 正确 的 ， 则 fi-1(ri,…) 是 正确 的 。] 

PV: P 传送 fi(ri1,…,z) 作为 z 的 多 项 式 的 所 有 系数 。( 这 里 ri1… 表 示 令 这 些 变 量 
等 于 前 面 随机 选取 的 值 ri srota) 

V 使 用 这 些 系数 计算 fiCri…,0) 和 fi(ri…,1)。 

V 检查 下 述 等 式 

is ‘fArnew,l) FS; = V 
fiale) = vi 
ft OS = A 
和 
fia amr) = G — ryf 0) 十 Xi +5; —R 

AN RIL, W V 拒绝 。 

V>P: 了 从 下 中 取 一 个 随机 数 >， 并 且 把 它 传 送 给 P. CASRN, AKT RA 
前 面 的 >。) 

转 到 阶段 it 1, P 必须 使 V 相信 Sicor) 是 正确 的 。 

阶段 K+1 [V 直接 验证 fi (rl,…,rm) 是 正确 的 。] 

V 计算 方 (rm，…rm)， 并 且 与 它 知道 的 f(ri，…,rm)》 值 比较 。 如 果 两 者 相等 ， 则 V 
接受 ; 否则 拒绝 。 整 个 协议 的 描述 完毕 。 

这 个 协议 的 正确 性 证 明 类 似 于 #5SAT 协议 的 正确 性 证 明 。 显 然 ， 如 果 y 为 真 , 则 P 
能 够 执行 协议 ， 并 且 V 将 会 接受 。 如 果 y 为 假 ， 则 PP 在 阶段 0 必须 说 谎 ， 传 送 一 个 不 正确 
的 foO 的 值 。 在 阶段 i:， 如 果 V 有 不 正确 的 fit) WE, W firi) 和 fines. DD 


中 一 定 有 一 个 值 不 正确 ， 从 而 关于 f; HERR- EREM. KI, ENB i mE PE 
Z, fimer) 正确 的 概率 不 超过 这 个 多 项 式 的 次 数 除 以 有 限 域 大 的 大 小 ， 即 n/n*。 协 
议 进行 O(n?) 个 阶段 ， 故 P 在 某 个 阶段 走运 的 概率 不 超过 1/n。 如 果 P 永远 不 走运 ， 则 
V 将 在 阶段 十 1 拒绝 。 i 
10.5 并行 计算 

并 行 计算 机 (parallel computer) 是 能 够 同时 执行 多 个 操作 的 计算 机 。 用 并 行 计算 机 
求解 某 些 问题 可 能 会 比 用 顺序 计算 机 (sequential computer) 快 得 多 ,后 者 每 次 只 能 做 一 
个 操作 。 在 实践 中 ， 两 者 之 间 的 差别 有 点 模糊 不 清 ， 因 为 多 数 真实 的 计算 机 (包括 “ 顺 
序 ” 计 算 机 ) 被 设计 成 在 执行 各 条 指令 时 使 用 某 种 并 行 性 。 我 们 在 这 里 关注 的 是 大 规模 并 
行 性 ， 即 在 一 个 计算 中 有 数量 巨大 《比如 数 百 万 或 更 多 ) 的 处 理 单 元 一 起 积极 参与 工作 。 

本 节 简 洁 地 介绍 并 行 计算 理论 ， 描 述 一 个 并 行 计算 机 的 模型 ， 然 后 利用 这 个 模型 给 出 
几 个 能 够 很 好 并 行 化 的 问题 。 此 外 ， 还 要 讨论 并 行 化 不 适合 某 些 问题 的 可 能 性 。 


10.5.1 一 致 布尔 电路 


在 并 行 算法 的 理论 研究 中 ， 用 得 最 多 的 模型 之 一 叫 作 并 行 随机 存 取 机 (Parallel Ran- 
dom Access Machine, PRAM), Æ PRAM 模型 中 ， 理 想 化 的 处 理 器 具有 一 个 简单 的 模仿 
实际 计算 机 的 指令 集 ， 它 们 通过 共享 存储 相互 作用 。 在 这 一 小 节 中 ， 不 可 能 详细 地 描述 
PRAM, 我 们 使 用 在 第 9 章 为 别 的 目的 引入 的 男 一 个 并 行 计算 机 模型 一 一 布尔 电路 。 

作为 并 行 计 算 模 型 ， 布 尔 电 路 有 上 自己 的 优点 和 缺点 。 从 好 的 方面 讲 ， 这 个 模型 的 描述 
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简单 ， 使 证 明 比 较 容 易 。 电 路 还 明显 地 像 现 实 中 的 硬件 设计 ， 在 这 个 意义 上 模型 是 现实 
的 。 从 不 好 的 方面 讲 ， 由 于 各 个 处 理 器 是 很 弱 的 ， 电 路 不 便于 用 来 “编程 ”。 此 外 ， 在 布 
尔 电 路 的 定义 中 不 允许 有 回路 ， 而 现实 中 构造 的 电路 可 能 有 这 样 的 回路 。 

在 并 行 计算 机 的 布尔 电路 模型 中 ， 把 每 一 个 门 作 为 一 个 独立 的 处 理 器 ， 因 此 把 布尔 电 
路 的 处 理 器 复杂 度 (processor complexity) 定义 为 它 的 规模 。 认 为 每 一 个 处 理 器 在 一 个 单 
位 时 间 内 计算 它 的 函数 ， 因 此 把 布尔 电路 的 并 行 时 间 复 杂 度 (parallel time complexity) 
定义 为 它 的 深度 ， 即 从 一 个 输入 变量 到 输出 门 的 最 长 距离 。 

任何 一 个 具体 的 电路 都 有 固定 的 输入 变量 数 ， 故 像 定 义 9. 22 中 定义 的 那样 ， 我 们 用 
电路 族 判 定语 言 。 必 须 对 电路 族 强加 一 个 技术 性 要 求 ， 使 它们 对 应 于 PRAM 之 类 的 并 行 
计算 模型 。 在 这 类 模型 中 ， 一 台 机 器 能 够 处 理 各 种 长 度 的 输入 。 这 个 要 求 使 你 能 够 容易 地 
得 到 电路 族 中 的 所 有 成 员 。 这 个 一 致 性 Cuniformity) 要 求 是 合理 的 ， 因 为 只 知道 存在 小 
的 电路 判定 一 个 语言 的 某 些 成 员 并 不 是 很 有 用 ， 这 个 电路 本 身 可 能 很 难 找到 。 因 而 给 出 下 

设 (Co ,Cl ,Cs ,…) 是 一 族 电 路 ， 如 果 存 在 对 数 空 间 的 转换 器 T 下 ， 当 了 
的 输入 为 1 m, ThE (Cr), MARERE MA. 

回忆 一 下 ， 和 定义 9. 23 分 别 用 最 小 规模 和 最 小 深度 的 电路 族 定义 语言 的 规模 复杂 度 和 
深度 复杂 度 。 为 了 明确 要 实现 一 个 具体 的 并 行 时 间 复 杂 度 需要 多 少 处 理 器 ， 或 者 反 过 来 要 
实现 一 个 具体 的 处 理 器 复杂 度 需 要 多 少 并 行 时 间 ， 我 们 在 这 里 同时 考虑 一 个 电路 族 的 规模 
和 深度 。 如 果 存 在 规模 复杂 度 为 f(n) 和 深度 复杂 度 为 g(n) 的 一 致电 路 族 识 别 某 个 语言 ， 
则 称 这 个 语言 的 规模 - 深度 联合 电路 复杂 度 不 超过 (f(n),g(n))。 

SAE {0,1) 上 由 所 有 含 奇数 个 1 的 字符 串 组 成 的 语言 。 通 过 计算 奇偶 
函数 可 以 检查 A 的 成 员 资 格 。 可 以 用 标准 的 AND、OR A NOT 运算 实现 两 个 输入 的 奇偶 
门 X@y 二 (XA 一 y)V ("zxAy)。 设 电路 的 输入 为 zl,…,z。 获 取 奇 偶 图 数 的 电路 的 一 个 
办 法 是 构造 g; 门 ， 这 里 gl =z sgi = tigi- Kn). AAA EEM On) 规模 和 O(n) 
TRIE 。 

例 9.24 Hwee Nsom, Fa SAP ea APS AA O(n) 规模 和 O(log n) 
深 度 的 电路 。 这 个 构造 有 重大 的 改进 ， 它 使 用 的 并 行 时 间 比 前 者 指数 地 少 。 因 此 ，A 的 规 
模 - 深度 复杂 度 为 (O(n) ,O(log n)). z 

回忆 一 下 ， 可 以 用 电路 计算 输出 字符 串 的 函数 。 考 虑 布尔 矩阵 乘法 函数 。 
输入 是 2m? =n 个 变量 ,表示 两 个 mXm EEAS {agr} 和 B= 二 (bx}。 输 出 是 m ME, K 
示 mXm FER C={cx}, HP 

Cik = VV Cay A ba) 
对 于 每 一 个 i，; 和 &， 这 个 函数 的 电路 有 计算 ay 入 bi 的 门 gijx。 男 外 ， 对 于 每 一 个 i 和， 
电路 包含 一 棵 计算 V jg i 的 或 门 的 二 元 树 。 每 一 棵 这 样 的 树 有 m 一 1 个 或 门 和 log m 的 深 
度 。 因 此 ， 这 些 布尔 矩阵 乘法 电路 的 规模 为 Om) =0n?), REX O(logn)。 & 

w A 二 (a;;) 是 一 个 mXm 布尔 矩阵 ，A 的 传递 闭 包 (transitive closure) 
是 和 矩阵 

A VV A? V eo. V A”™ 


272 REIER 复杂 性 理论 


其 中 A 是 i 个 A 的 矩阵 乘积 ，V 是 矩阵 元 素 的 按 位 OR。 传 递 闭 包 运 算 与 PATH 问题 天 
系 密切 ， 因 而 与 NL 类 的 关系 密切 。 设 A 是 有 问 图 G 的 邻接 和 矩阵，A: 是 顶点 与 G 相同 、 
边 表示 G 中 存在 长 度 为 i 的 路 径 的 图 的 邻接 矩阵 。A 的 传递 团 包 是 图 的 邻接 和 矩阵， 图 中 的 
边 表示 G 中 存在 一 条 路 径 。 

可 以 用 规模 为 i 和 深度 为 logi 的 二 元 树 表示 A 的 计算 ， 其 中 每 个 项 点 计算 它 下 面 的 
两 个 矩阵 的 乘积 。 每 个 顶点 是 一 个 OC?) 规模 和 对 数 深 度 的 电路 。 因 此 ， 计 算 A” 的 电 
路 的 规模 为 O(n?)， 深 度 为 O(log:n)。 对 每 一 个 Ai 构造 一 个 电路 ， 共 要 添加 Olm) = 
On? ) 规 模 和 O(logn) 深度 。 因 此 ,传递 闭 包 的 规模 - 深度 复杂 度 为 (O(n )， 
O(log’n))., mi 


10.5.2 NC 类 


许多 感 兴 趣 的 问题 具有 规模 - 深度 复杂 度 (OCm*),O(logtn))， 其 中 上 有 是 常数 。 可 以 
认为 ， 这 样 的 问题 是 能 够 用 适当 数量 的 处 理 机 高 度 并 行 化 的 。 这 促使 我 们 定义 NC 类 。 

Fil, SNC 是 能 够 用 多 项 式 规模 和 O 〇 (login) 深度 的 一 致电 路 
族 识别 的 语言 类 。NC 是 所 有 在 某 个 NC 中 的 语言 组 成 的 语言 类 。 用 这 种 电路 族 计 算 的 函 
数 分 别 叫 作 NC! 可 计算 的 和 NC 可 计算 的 9 。 

下 面 考察 这 些 复 杂 类 与 我 们 见 过 的 其 他 语言 类 的 关系 。 首 先 给 出 图 灵机 空间 与 电路 深 
度 之 间 的 联系 。 在 对 数 深 度 内 可 解 的 问题 在 对 数 空 间 内 也 是 可 解 的 。 反 过 来 ， 在 对 数 空 间 
内 其 至 在 非 确 定型 对 数 空 间 内 可 解 的 问题 都 是 在 对 数 平方 深度 内 可 解 的 。 

Gael) NCISL. 

证 明 ”我 们 扼要 地 描述 识别 NC 中 的 语言 A 的 对 数 空间 算法 。 对 于 长 度 为 的 输入 
w， 算 法 构造 关于 A 的 一 致电 路 族 中 的 第 ”个 电路 ， 然 后 通过 从 输出 门 开始 的 深度 优先 搜 
索 计 算 这 个 电路 的 值 。 (为 了 掌握 搜索 的 进展 ) 只 需 记 录 到 当前 正在 考察 的 门 的 路 径 以 及 
沿 这 条 路 径 所 获得 的 部 分 结果 。 电 路 具有 对 数 深 度 ， 因 此 模拟 只 需要 对 数 空间 。 ie 

NLENG?. 

证 明 思 路 ”计算 一 台 NL 机 格局 图 的 传递 闭 包 。 输 出 表示 是 否 存 在 从 起 始 格 局 到 接受 
格局 的 路 径 的 状态 。 

证 明 设 A 是 被 一 台 NL 机 M 识别 的 语言 ， 这 里 A 已 被 编码 到 (0,1) 上 。 要 构造 A 
的 一 致电 路 族 (Co ,Cl,…)。 为 了 得 到 C, ， 要 构造 一 个 图 G， 它 很 像 M 对 长 度 为 的 输入 
w 的 计算 图 。 在 构造 电路 时 ， 我 们 不 知道 输入 w， 只 知道 w 的 长 度 n。 电 路 的 输入 是 变量 
wi 到 ww ， 每 一 个 wi 对 应 输入 中 的 一 个 位 置 。 

回忆 一 下 ，M 关于 w 的 格局 描述 了 M 的 状态 、 工 作 带 的 内 容 以 及 输入 头 和 工作 读 写 
头 的 位 置 ， 但 不 包括 w kh., AE, MEF uw 的 格局 集合 实际 上 不 依赖 于 ww， 而 仅 与 w 
的 长 度 n 有 关 。 这 些 多 项 式 个 格局 构成 G 的 顶点 集 。 

在 G 的 边 上 标记 输入 变量 w;。 设 cl Me 是 G 的 两 个 顶点 ，cl 指明 输入 头 的 位 置 是 


O HNC 来 说 ， 用 对 数 空间 转换 器 定义 一 致 性 是 标准 的 (i 宇 2 时 ), 但 对 于 NC’ 来 讲 ， 它 给 出 一 种 不 标准 的 
结果 (NC! 包含 子 集 标准 化 类 NC:) 。 尽 管 如 此 ， 我 们 还 是 给 出 该 定义 ， 因 为 它 更 简单 ， 而 且 能 满足 我 们 的 
需要 。 

© Steven Cook 用 “Nick 类 ”来 命名 NC, AW Nick Pippenger 是 最 早 认 识 到 NC 重要 性 的 人 。 
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1。 当 输入 头 在 读 1 (或 0) 时 ， 按 照 M 的 转移 函数 ，cl 能 够 一 步 产生 cz ， 则 给 G 中 的 边 
(clycz) 标记 w; (或 w?) 。 如 果 不 管 输入 头 在 读 什 么 ，cl 都 能 够 一 步 产 生 cx ， 则 不 给 G 中 
的 这 条 边 作 标记 。 

如 果 根 据 长 度 为 n 的 字符 串 w 安置 好 G 的 边 ， 则 存在 从 起 始 格局 到 接受 格局 的 路 径 
当 且 仅 当 M 接受 w。 因 此 ， 构造 一 个 电路 计算 G 的 传递 闭 包 ， 并 且 输 出 表示 是 否 存 在 这 
种 路 径 的 状态 ， 它 恰好 接受 A 中 长 度 为 n 的 字符 串 。 这 个 电路 具有 和 多项式 的 规模 和 
OUlog?n) RE. 

使 用 一 台 对 数 空 间 转 换 器 ， 能 够 对 输入 1” 构造 G 和 C，,。 请 参见 定理 8.20 中 关于 一 
个 类 似 的 对 数 空 间 转 换 估 的 详细 描述 。 名 

多 项 式 时 间 可 解 的 问题 类 包括 NC 中 的 所 有 问题 。 下 述 定理 叙述 这 一 关系 。 

NCCP, 

证 明 ”能够 用 一 个 多 项 式 时 间 算 法 运行 对 数 空间 转换 器 ， 生 成 电路 C,， 然 后 模拟 Cn 
对 长 度 为 n 的 输入 的 计算 。 5 


10.5.3 已 完全 性 


现在 考虑 P 中 所 有 问题 也 在 NC 中 的 可 能 性 。 如 果 这 两 个 语言 类 相等 ， 那 是 完全 出 人 
意料 的 ， 因 为 这 意味 着 所 有 多 项 式 时 间 可 解 的 问题 都 能 够 高 度 并 行 化 。 下 面 介 绍 P 完全 
性 ， 它 提供 了 P 中 某 些 问题 是 固有 可 串 行 化 的 理论 根据 。 

STEED vz 

1. BEP, 

2. P 中 每 一 个 A 对 数 空 间 可 归 约 到 B， 
则 称 语言 B 是 P 完全 的 。 

下 述 定理 仿效 定理 8. 18， 并 且 由 于 NC 电路 族 能 够 计算 对 数 空间 归 约 ， 故 可 以 类 似 地 
证 明 它 。 我 们 把 它 的 证 明 留 作 练 习 10. 3。 

GERD 如 呆 A<LB 且 B 在 NC 中 ,， 则 A 在 NC 中 ， 

我 们 证 明 电 路 计算 问题 是 P 完全 的 。 对 于 电路 C 和 输入 xz, WC) ACKT «cH 
值 。 令 CIRCUIT-VALUE={(C,x)|C 是 布尔 电路 且 C(x)=1}。 

GEME ”CIRCUIT VALUE 是 P 完全 的 。 

证 明 定理 9.25 中 给 出 的 构造 说 明了 如 何 把 P 中 任意 的 语言 A 归 约 到 CIRCUIT- 
VALUE 。 对 于 输入 w， 归 约 生 成 一 个 模拟 A 的 多 项 式 时 间 图 灵机 的 电路 。 该 电路 的 输入 
是 w 本 身 。 由 于 生成 的 电路 具有 简单 和 重复 的 结构 ， 归 约 能 够 在 对 数 空间 内 实现 。 # 


10.6 密码 学 


在 通信 和 领域 中 使 用 密码 的 加 密 技 术 可 追溯 到 几 千 年 前 。 在 古 罗 马 时 期 ， 儒 略 。 人 已 撤 把 
给 他 的 将 军 们 的 命令 译 成 密码 ， 以 防止 被 敌人 截取 。 在 第 二 次 世界 大 战 中 ， 图 灵机 的 发 明 
AME + 图 灵 领 导 一 个 英国 数学 家 小 组 破译 德国 人 的 密码 ， 德 国人 用 这 些 密码 给 正在 大 西 
洋 上 巡逻 的 洪 艇 发 送 命令 。 现 在 各 国政 府 十 分 重视 密码 技术 ， 投 入 很 大 的 力量 研究 很 难 破 
译 的 密码 和 寻找 别人 使 用 的 密码 的 弱点 。 如 今 ， 公司 和 个 人 也 使 用 加 密 增加 信息 的 安全 。 
不 久 的 将 来 ， 几 乎 所 有 的 电子 通信 将 会 受到 密码 保护 。 
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近年 来 ， 计 算 复杂 性 理论 给 密码 设计 带 来 一 场 革 命 。 人 们 都 知道 ， 密 码 学 人 研究 的 领域 
目前 超出 了 传统 的 通信 范围 ， 而 要 面 对 众 多 涉及 信息 安全 的 问题 。 例 如 ， 现 在 有 一 种 技 
术 ， 经 过 数字 “签名 ”后 的 报 文 可 以 鉴定 发 送 人 的 身份 ; 可 以 进行 电子 选举 ， 选 民 在 网 上 
投票 和 公开 统计 选举 结果 ， 不 会 泄露 任何 人 的 投票 情况 ， 能 防止 重复 投票 和 其 他 违法 行 
为 ; 构造 不 要 求 通信 双方 预先 约定 加 密 和 解密 算法 的 新 型 密码 。 

密码 学 是 复杂 性 理论 的 重要 实践 领域 。 数 字 蜂 窝 电 话 、 卫 星 电视 直播 以 及 网 上 电子 商 
务 等 全 都 依赖 加 密 措施 保护 信息 。 这 些 系统 已 进入 大 多 数 人 的 日 前 生活 。 密 码 学 已 经 促进 
了 复杂 性 理论 和 其 他 数学 领域 内 的 许多 研究 。 


10.6.1 $H 


在 传统 解密 技术 中 ， 当 发 信人 打算 给 报 文 加 密 ， 使 得 只 有 某 个 接收 人 能 够 对 它 解密 
时 ， 发 信人 和 收 信 人 共有 一 个 密 钥 (secret key) 。 密 钥 是 加 密 算 法 和 解密 算法 使 用 的 一 段 
信息 。 因 为 任何 得 到 密 钥 的 人 都 能 够 加 密 和 解密 报 文 ， 故 保守 密 钥 的 秘密 对 密码 的 安全 是 
至 关 重 要 的 。 

如 果 密 钥 太 短 ， 可 以 通过 蛮 力 搜索 整个 密 钥 空间 发 现 它 。 其 至 长 一 些 的 密 钥 也 可 能 容 
易 受 到 某 些 攻击 等 会 儿 还 要 谈 这 个 问题 。 使 密码 绝对 安全 的 唯一 办 法 是 使 用 与 发 送 的 
全 部 报 文 一 样 长 的 密 钥 。 

与 报 文 一 样 长 的 密 钥 叫 作 一 次 性 衬 垫 (one-time pad) 。 本 质 上 ， 一 次 性 衬 垫 密 钥 的 每 
一 位 只 使 用 一 次 ， 用 来 加 密 报 文 的 一 位 ， 以 后 不 再 使 用 密 钥 的 这 一 位 。 一 次 性 衬 垫 的 主要 
问题 是 ， 如 果 通 信 量 很 大 则 密 钥 可 能 相当 大 。 因 此 ， 就 大 多 数 的 目的 而 言 ， 一 次 性 衬 垫 由 
于 非常 不 便 通 常 被 认为 是 不 实际 的 。 

使 用 中 等 长 度 的 密 钥 ， 可 以 进行 不 限量 安全 通信 的 密码 是 更 可 取 的 。 有 趣 的 是 ， 理 论 
上 不 可 能 有 这 样 的 密码 ， 但 矛盾 的 是 ， 在 实践 中 却 使 用 着 它们 。 在 理论 上 不 可 能 有 这 种 类 
型 的 密码 ， 是 因为 能 够 对 可 能 的 密 钥 空间 进行 覃 力 搜索 ， 找 到 比 报 文 短 很 多 的 密 钥 。 因 
此 ， 以 这 种 密 钥 为 基础 的 密码 在 原则 上 是 可 破译 的 。 对 这 种 自 相 矛盾 的 怪事 有 一 种 解释 。 
因为 当 密 铀 有 中 等 长 度 时 ， 比 如 100 位 ， 蛮 力 搜索 太 慢 ， 所 以 密码 在 实践 中 无 论 如 何 是 能 
够 保证 足够 的 安全 的 。 当 然 ， 如 果 密 码 能 用 其 他 的 快速 方式 破译 ， 那 么 它 也 是 不 安全 和 不 
应 该 使 用 的 。 最 重要 的 是 ， 要 确认 密码 不 可 能 被 快速 破译 。 

现在 还 没有 办 法 保证 使 用 中 等 长 度 密 钥 的 密码 实际 上 是 安全 的 。 为 保证 密码 不 能 被 快 
速 破 译 ， 至 少 需 要 在 数学 上 证 明 不 能 快速 地 找到 密 钥 。 然 而 ， 这 样 的 证 明 似 乎 超出 当代 数 
学 的 发 展 水 平 ! 理由 如 下 ， 一 且 发 现 密 铀 ， 验 证 它 的 正确 性 是 容易 做 到 的 ， 只 需 检查 用 它 
解密 后 的 报 文 。 因 此 ， 密 钥 验 证 问题 可 以 公式 化 为 P 中 的 一 个 问题 。 如 果 能 够 证 明 不 能 在 
多 项 式 时 间 内 找到 密 钥 ， 就 证 明了 P 不 等 于 NP， 从 而 取得 重大 的 数学 进展 。 

由 于 不 能 从 数学 上 证 明 密 码 是 不 可 破译 的 ， 因 此 改 成 依靠 实践 证 据 。 在 过 去 ， 蜜 码 的 
质量 靠 雇 用 专家 来 评价 。 请 他 们 破译 密码 ， 如 果 他 们 不 能 破译 ， 就 会 增加 对 密码 安全 性 的 
可 信和 度 。 这 种 方法 有 明显 的 不 足 。 如 果 别 人 有 比 我 们 更 好 的 专家 ， 或 者 我 们 对 上 自己 的 专家 
缺乏 信任 ， 那 么 密码 的 完整 性 可 能 受到 损害 。 尽 管 如 此 ， 直 到 最 近 这 还 是 唯一 可 供 使 用 的 
方法 ， 像 美国 国家 标准 与 技术 局 正式 批准 的 数据 加 密 标 准 (DES) 这 样 一 些 广泛 使 用 的 密 
码 的 可 靠 性 也 有 赖 于 它 。 

计算 复杂 性 理论 提供 了 另 一 种 获得 密码 安全 性 证 据 的 方法 。 我 们 可 以 给 出 破译 这 个 密 
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码 的 复杂 度 与 男 外 茶 个 问题 的 复杂 度 之 间 的 联系 ， 而 后 者 已 经 有 使 人 相信 的 难 解 性 证 据 。 
回忆 一 下 ， 我 们 已 经 用 NP 完全 性 作为 某 些 问题 难 解 的 证 据 。 把 一 个 NP 完全 问题 归 约 到 
密码 破译 问题 ， 可 以 证 明 这 个 密码 破译 问题 本 身 是 NP 完全 的 。 但是， 这 没有 提供 安全 的 
充分 证 据 ， 因 为 NP 完全 性 涉及 最 坏 情况 的 复杂 性 。 一 个 问题 虽然 是 NP 完全 的 ,但 是 有 
可 能 在 大 多 数 时 候 它 是 容易 解 的 。 密 码 则 必须 总 是 很 难 破译 的 ， 因 而 需要 考虑 平均 复杂 
度 ， 而 不 是 最 坏 情况 的 复杂 度 。 

整数 因子 分 解 问题 是 公认 的 在 平均 情况 下 非常 难 解 的 问题 。 几 个 世纪 以 来 ， 一 些 项 尖 
数学 家 一 直 对 因子 分 解 感 兴趣 ， 但 是 还 没有 人 发 现 它 的 快速 算法 。 围 绕 因 子 分 解 问题 已 经 
建立 了 茶 些 现代 密码 ， 破 译 这 种 密码 对 应 因子 分 解 一 个 数 ， 这 就 构成 这 些 密码 是 安全 的 、 
令 人 信服 的 证 据 。 因 为 破译 这 种 密码 的 有 效 方法 能 够 导出 快速 的 因子 分 解 算法 ， 这 可 是 计 
算数 论 中 的 重大 进展 ! 


10.6.2 公 钥 密码 系统 


在 传统 的 密码 学 中 ， 甚 至 当 密 钥 适 当地 短 时 ， 密 码 的 管理 仍 是 普遍 使 用 密码 的 一 个 障 
碍 。 一 个 问题 是 每 一 对 希望 进行 专门 通信 的 双方 需要 为 此 建立 一 个 联合 密 钥 。 男 一 个 问题 
是 每 一 个 人 需要 保存 一 个 秘密 的 数据 库存 放 所 有 这 样 建立 起 来 的 密 钥 。 

新 近 开 发 的 公 钥 密码 很 好 地 解决 了 这 两 个 问题 。 在 传统 的 私 钥 密码 系统 (private key 
cryptosystem) 中 ， 加 密 和 解密 使 用 相同 的 密 钥 。 与 此 不 同 ， 在 公 钥 密码 系统 (public-key 
cryptosystem) 中 ， 解 密 密 钥 不 同 于 加 密 密 钥 ， 并 且 不 容易 从 加 密 密 钥 中 计算 出 来 。 

虽然 可 能 有 人 认为 这 是 一 个 简单 想法 ,但 是 将 两 种 密 钥 分 开 产 生 了 意义 深远 的 结果 。 
现在 每 一 个 人 只 需要 建立 一 对 密 钥 : 一 个 加 密 密 钥 E 和 一 个 解密 密 钥 D。 各 人 保守 自己 的 
D 的 秘密 而 公开 上。 如 果 乙 想 给 甲 发 一 条 报 文 ， 乙 要 在 公共 的 密 钥 禾 上 找到 甲 的 E， 用 
它 加 密 报 文 ， 然 后 发 送 给 甲 。 甲 是 唯一 知道 自己 的 DD 的 人 ， 所 以 只 有 他 能 够 解密 这 段 
报 文 。 

某 些 公 钥 密码 系统 还 可 以 用 于 数字 签名 (digital signature)。 如 果 一 个 人 在 发 送 报 文 
之 前 对 它 运 用 他 的 保密 的 解密 算法 ， 则 任何 人 能 够 运用 他 的 公开 的 加 密 算法 验证 报 文 确实 
是 他 发 的 。 于 是 ， 他 有 效 地 “签署 ”了 那 段 报 文 。 这 种 应 用 要 求 可 以 以 任何 顺序 运用 加 密 
算法 和 解密 算法 ，RSA 密码 系统 就 是 这 样 的 。 


10. 6.3 单 向 函数 


单 向 函数 和 天 窗 函 数 是 现代 密码 学 理论 的 基础 。 用 复杂 性 理论 作为 密码 学 基础 的 一 个 
优点 是 ， 它 有 助 于 在 我 们 辩论 安全 性 时 提供 一 个 共同 的 假设 平台 。 在 存在 单身 函数 的 假设 
下 ， 能 够 构造 出 安全 的 私 钥 密码 系统 。 在 存在 天 窗 函 数 的 假设 下 ， 能 够 构造 出 公 钥 密码 系 
统 。 这 两 个 假设 还 有 一 些 其 他 的 理论 和 应 用 的 结果 。 在 做 一 些 准备 后 我 们 将 定义 这 两 种 
RŽ. 

如 果 对 每 一 个 w, w Af) KWKERG, MEAR f:3* 一 3* 是 保 长 的 〈length- 
preserving)。 如 果 保 长 函数 不 会 把 两 个 不 同 的 字符 串 映射 到 同一 个 字符 串 ， 即 当 x 关 y 时 ， 
f(z) 关 f(y)， 则 称 它 是 一 个 置换 (permutation), 

回忆 一 下 10. 2 市 给 出 的 概率 图 灵机 的 定义 。 假 定 概 率 图 灵机 M 计算 概率 函数 M:5* > 
353* ， 这 里 对 每 一 个 输入 w 和 输出 x， 令 
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Pri M(w) = z] 
为 M 从 输入 w 开始 停机 在 接受 状态 且 停 机 时 带 的 内 容 为 z 的 概率 。 注 意 ，M 对 输入 w 有 
时 可 能 不 接受 ， 故 
>) PM) = x] <1 
rez 

Pie XA in pea. AR, —S MEAN ER RMA DITA, 8 
来 几乎 总 是 困难 的 。 在 下 面 的 定义 中 ，j 了 表示 容易 计算 的 单 回 函数 ，M 表示 企图 反 演 f 的 
多 项 式 时 间 概 率 算法 。 单 向 置换 是 一 种 较 简 单 的 单 向 函数 。 因 此 下 面 先 定义 单 向 置换 ， 再 
定义 单 问 函数 。 

单 向 置换 (one-way permutation) 是 具有 下 述 两 条 性 质 的 置换 f: 

1. 了 是 多 项 式 时 间 可 计算 的 。 

2. 对 于 每 一 台 多 项 式 时 间 概 率 图 灵机 M、 每 一 个 k 和 充分 大 的 n， 如 果 取 长 度 为 n 的 
随机 串 w 并 且 对 输入 f(w) 运行 M， 则 

Prime MC flo) = wl anr? 
这 里 Prm,w 表 示 概 率 是 在 M 所 做 的 随机 选择 和 w 的 随机 选取 上 取 到 的 。 

单 向 函数 (one-way function) 是 具有 下 述 两 条 性 质 的 保 长 函数 f: 

l 了 是 多 项 式 时 间 可 计算 的 。 

2. 对 于 每 一 台 多 项 式 时 间 概 率 图 灵机 M、 每 一 个 有 k 和 充分 大 的 n， 如 果 取 长 度 为 n 的 
MALS w 并且 对 输入 flw) 运行 M， 则 

Primul Me fm = yk P f(y) = fFe] n” 

对 于 单 回 置换 ， 任 何 多 项 式 时 间 概 率 算 法 只 能 以 很 小 的 概率 反 演 f， 即 不 大 可 能 从 
f(w) 计 算出 w。 对 于 单 向 孔 数 ， 任 何 多 项 式 时 间 概 率 算法 不 大 可 能 找到 一 个 映射 到 f(w) 
的 y。 

乘法 函数 mule 可 能 是 一 个 单 向 函数 。 设 3 一 40,1} 。 对 于 任意 的 wer, 
令 mult(w) 是 表示 w 的 前 一 半 与 后 一 半 乘 积 的 字符 串 。 形 式 地 表示 为 : 

mult (w) = wi * we 
其 中 w 二 wiwz ， 且 当 |w| 为 偶数 时 ，|w | 二 |wz|; 当 |w| 为 奇数 时 ，| wl|=lee|/+l. w 
和 we 作为 二 进 制 数 处 理 。 在 multi(w) 的 前 面 添加 0 使 得 它 与 w 一 样 长。 尽管 人 们 对 整 
数 因 了 于 分 解 问 题 做 了 大 量 研究 ， 但 还 不 知道 有 多 项 式 时 间 概 率 算法 能 够 反 演 mult, BN EXT 
于 输入 的 多 项 式 分 之 一 也 不 知道 这 样 的 算法 。 a 

Qn SR (Be ie FF ER Im] pRB, MU A a tet 2c ET EB BY A BS AAS. TE HK 
个 构造 太 复杂 了 。 作 为 一 种 蔡 代 ， 我 们 说 明 如 何 使 用 单 向 函数 实现 密码 的 另 一 种 应 用 。 

安全 性 可 证 明 的 口令 系统 是 单身 函数 的 一 个 简单 应 用 。 在 典型 的 口令 系统 中 ， 用 户 必 
须 键 人 一 个 口令 才能 访问 某 个 资源 。 系 统 用 加 密 方式 保存 用 户口 令 数 据 库 。 给 口令 加 密 是 
为 了 当 数 据 库 偶然 地 或 故意 地 不 加 保护 时 保护 它们 。 口 令 数据 库 经 常 是 不 加 保护 的 ， 使 得 
各 种 应 用 程序 能 够 读 它们 和 验证 口令 。 当 用 户 键 人 一 条 口令 后 ， 系 统 先 对 它 加 密 ， 然 后 判 
断 它 是 否 与 数据 库 中 存储 的 形式 相 匹 配 ， 这 样 就 能 验证 它 的 有 效 性 。 显 然 ， 我 们 希望 加 密 
方案 是 很 难 反 演 的 ， 使 得 很 难 从 口令 的 加 密 形式 得 到 不 加 密 的 口令 。 人 们 自然 会 选择 单 向 
K RUE J O S mA RA. 
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10.6.4 RAAH 


我 们 不 知道 如 果 存 在 单 向 函数， 是否 一 定 能 够 构造 公 钥 密码 系统 。 为 了 得 到 这 样 的 系 
统 ， 要 使 用 天 窗 函 数 ， 对 于 专门 的 信息 它 能 够 有 效 地 反 演 。 

首先 ， 需 要 讨论 给 函数 族 做 索引 的 函数 。 设 有 因数 族 {fi}， 其 中 i€3* ， 可 以 用 一 
不 函数 产 3 xX SS 表示 它 们 ，。 这 里 对 于 每 一 个 2 和 wivw) 一 天 (WwW》。 称 半 是 一 个 
索引 函数 。 如 果 每 一 个 被 索引 函数 f; 是 保 长 的 ， 则 说 f 是 保 长 的 。 

KB BR (trapdoor function) 是 带 有 一 台 辅 助 的 多 项 式 时 间 概 率 图 灵 
机 G fa — 4 FH BA Ah: E XE 一 >* 的 保 长 索引 函数 f:53* X535* 一 3* 。 三 件 套 Ff. GF 
h 满足 下 述 3 个 条 件 : 

l. 函数 了 Fh 是 多 项 式 时 间 可 计算 的 。 

2. 对 于 每 一 个 多 项 式 时 间 概 率 图 灵机 尼 、 每 一 个 kk 和 充分 大 的 n， 如 果 取 G 对 1” 的 
随机 输出 (it) PpP wed”, N 

| Pireo Ei fi(w)) = yk f=) | 

3. 对 于 每 一 个 n、 每 一 个 长 度 为 n 的 w 和 G 对 任 一 输入 以 非 零 概率 输出 的 每 一 个 《i,1)， 
有 h(t,fi(w)) 二 y， 这 里 fi(y) 二 fi(w)。 

概率 图 灵机 G 生成 索引 族 中 一 个 函数 的 索引 ， 同 时 生成 一 个 值 :， 它 使 fi 成 为 能 快速 
反 演 的 函数 。 条 件 2 说 当 缺 少 上 时 f; 是 难 反 演 的 。 条 件 3 说 当 已 知 1 时 f; 是 容易 反 演 的 。 

这 里 描述 一 个 天 窗 函 数 ， 它 为 众所周知 的 RSA 密码 系统 葛 定 了 基础 。 给 
出 它 的 联合 三 件 套 f+、G 和 h。 生 成 机 器 G 按 如 下 方式 运作 。 在 输入 1 上 ， 它 随机 地 选取 
两 个 大 小 为 n 的 数 ， 测 试 它 们 是 否 为 素数 。 如 果 它 们 不 是 素数 ， 则 重新 选取 ， 直 到 成 功 地 
选取 两 个 素数 ,或 者 达到 预先 规定 的 暂 定 界限 ， 并 且 宣 布 失效 。 找 到 p 和 9g 以 后 ， 它 计算 
N=pq 和 $$(n) 二 (p 一 1)(g 一 1)。 选 取 1~$(n) 之 间 的 一 个 随机 数 e， 检 查 e 是 否 与 $(n) 
互 素 。 如 果 不 是 ， 则 另 取 一 个 数 并 且 重 复 检 查 。 然 后 ， 计 算 e 模 %(z) WHEW Id. X 
是 可 以 做 到 的 。 因 为 {(1,…，,%(Cz)》 PH dm) 互 素 的 数 在 模 b(n) 乘法 运算 下 构成 一 个 
群 。 最 后 ，G 输出 ((N,e).d). BA 了 的 索引 由 两 个 数 N 和 e 组 成 。 令 

fn,eCw) = w mod N 
MW RR h H 
h(d,x) = x mod N 

因为 h(d, fN eC(w)) =w mod N=w, WA h EMR f. = 

A ERRA KA, MER RSA 天 窗 函 数 ， 构 造 公 钥 密 码 系统 如 下 。 公 开 的 密 钥 是 
概率 图 灵机 G 产生 的 索引 i。 保 密 的 密 钥 是 对 应 的 值 :。 加 密 算 法 把 报 文 m 分 成 春 干 大 小 
不 超过 log N 的 块 。 对 于 每 一 块 ww， 发送 人 计算 f;。 所 得 到 的 字符 串 序 列 将 是 加 密 的 报 
文 。 接 收 人 用 函数 h 从 加 密 的 报 文 获得 原始 报 文 。 


练习 


10.1 证 明 : 深度 为 O(log n) 的 电路 族 是 多 项 式 规 模 的 电路 族 。 

10.2 证 明 : 12 不 能 通过 费 马 测 试 ， 从 而 不 是 伪 素 数 。 

10.3 WH: 如 果 A<LB 且 B 在 NC 中 ,， 则 A 也 在 NC 中。 

10.4 证 明 : 有 个 输入 的 奇偶 函数 能 用 OCn) 个 顶点 的 分 支 程 序 计算 。 
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10.5 WH: 有 7 个 输入 的 多 数 函 数 能 用 OCn?) 个 顶点 的 分 支 程 序 计 算 。 
10.6 WEH: 任何 有 个 输入 的 函数 都 能 用 OC(2") 个 顶点 的 分 支 程序 计算 。 
A10.7 证 明 : BPPCPSPACE, 
问题 
10.8 如果 BPL 是 概率 对 数 空间 图 灵机 以 错误 概率 地 判定 的 语言 集合 ， 证 明 BPLCP. 
10.9 如果 EQe = {Bı ,Bs)|Bl M B: 是 两 个 等 价 的 分 支 程序 } WEAR: EQsp 是 coNP 完全 的 。 
10.10 假定 ZPP- 机 器 M 是 一 台 概 率 图 灵机 。 它 的 每 个 分 支 有 三 种 输出 : 接受 、 拒 绝 和 ?。 如 果 M 对 
每 个 输入 串 w 都 输出 正确 答案 (如 果 wE A 则 接受 ， 如 果 wA 则 拒绝 ) 的 概率 大 于 等 于 2/3 
而 且 M 从 不 回答 错误 ， 则 M 判定 语言 A。 对 每 个 输入 ，M 输出 “?” 的 概率 至 多 为 1/3。 更 进 
一 步 ， 对 输入 w，M 所 有 分 支 上 的 平均 运行 时 间 一 定 限定 在 输入 串 w 长 度 的 多 项 式 时 间 。 令 
ZPP 是 ZPP- 机 器 识别 语言 的 集合 。 证 明 RP()coRP=ZPP. 
10.11 证 明 : 如 果 NPCBPP， 则 NP=RP. 
10.12 证 明 : MRA 是 一 个 正则 语言 ， 则 存在 分 支 程序 族 (Bi , Bs,…)， 使 得 每 一 个 B, 恰好 接受 A 
中 长 度 为 n 的 所 有 字符 串 ， 且 规模 不 超过 的 常数 倍 。 
10.13 WH: 如 果 A 是 工 中 的 一 个 语言 ， 则 存在 分 支 程 序 族 (Bi , Bs,…)， 使 得 每 一 个 B 恰好 接受 
A 中 长 度 为 n 的 所 有 字符 串 ， 且 规模 不 超过 nn 的 多 项 式 。 
A*10.14 证 明 : 对 于 任意 的 整数 pol, WR p 不 是 伪 素 数 ， 则 p 至 少 对 ZS 中 的 一 半 的 数 不 能 通过 费 
马 测 试 。 
10.15 回忆 一 下 ，NPsT 是 以 可 满足 性 问题 作 论 示 的 非 确 定型 多 项 式 时 间 图 灵机 识别 的 语言 类 。 证 
HA; NPAT = 5,P。 
10.16 证 明 费 马 小 定理 ， 即 定理 10.6。( 提 示 : 考虑 序列 aa’, 一定 发 生 什么 ? 如 何 发 生 ?) 
10.17 证 明 : W PH 二 PSPACE， 则 多 项 式 时 间 层 次 只 有 有 限 个 不 同 的 层次 。 
10.18 WH: Ww P=NP, Mj P=PH. 
10.19 设 M 是 一 台 多 项 式 时 间 概 率 图 灵机 ， 语 言 C 满足 下 述 条 件 : 对 于 某 个 固定 的 0<a<e<l, 
a. wÉ C 蕴涵 PrLM #% w] KE o 
b. wE C 蕴涵 Prl MHS w] Ser. 
证 明 : CE BPP. (42%: 利用 引 理 10.5.) 
10.20 & CNFu =i p) p 是 一 个 可 满足 的 cnf 公式 ， 其 中 每 个 子 句 包含 任意 多 个 文字 ， 但 最 多 只 有 
一 个 非 的 文字 }。 问 题 7. 52 要 求证 明 CNFaEP。 请 给 出 从 CIRCUIT- VALUE 到 CNFH 的 对 
数 空间 归 约 ， 从 而 得 到 CNFH 是 P- 完全 的 结论 。 
* 10.21 k 头 下 推 自 动机 (e PDA) 是 具有 上 个 双向 只 读 输入 头 和 一 个 读 写 栈 的 确定 型 下 推 自 动机 。 定 
义 语言 类 
PDA, = 二 {A|A 被 一 台 k-PDA 识别 } 
WH: P=U,PDA,. ATR: 回忆 一 下 ，P 等 于 交错 式 对 数 空间 可 识别 的 语言 类 .) 
* 10. 22 布尔 公式 是 一 个 布尔 电路 ， 其 中 每 一 个 门 只 有 一 条 输出 线 ， 同 一 个 输入 变量 可 以 在 布尔 公式 
的 多 处 出 现 。 证 明 : 一 个 语言 具有 和 多项式 规模 的 公式 族 当 且 仅 当 它 在 NC 中 。 这 里 不 考虑 一 
致 性 。 
10.23 设 A 是 {0,1》 上 的 正则 语言 。 证 明 A 的 规模 - 深度 复杂 度 为 〈O(Cz) ,O(log n)). 
习题 选 解 
10.7 WÈ M 是 一 个 运行 于 多 项 式 时 间 的 概率 图 灵机 ， 对 某 个 常数 r+ 我 们 对 M 进行 修改 ， 使 得 它 只 


能 在 每 一 计算 分 支 上 恰好 进行 n 次 抛 硬币 试验 。 于是， 判定 M 接受 输入 串 的 概率 的 问题 转化 
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为 计算 有 多 少 个 接受 分 支 ， 并 把 计算 结果 与 2" 进行 比较 。 这 种 计算 消耗 多 项 式 空间 。 


如 果 一 个 数 a Xt p 不 能 通过 费 马 测试 ， 即 at 'Al(mod p)， 则 称 a 为 一 个 见证 。 令 Zp 表示 
{1,…,p 一 1) 中 所 有 与 p 互 素 的 数 。 如 果 p 不 是 伪 素 数 ， 它 在 区 中 有 一 个 见证 a。 

使 用 a 可 以 得 到 很 多 的 见证 。 对 每 一 个 非 见证 ， 在 ZS 中 找到 一 个 独特 的 见证 。 如 果 dE Zi 
是 一 个 非 见证 ， 能 够 得 到 dp-1 三 1(mod p)。 因 此 ， (da mod p)* ! 关 1(mod p), Wi, 
da mod p 是 一 个 见证 。 如 果 di M d? Æ Z 中 两 个 不 同 的 非 见 证 ， 则 dia mod p#d2a mod p, 
否则 ，(di 一 dz )a 夺 0(mod p)， 故 而 对 有 些 整 数 c,(di 一 dz )a 一 cb。 但 是 因为 M dz: Æ Z? 
中 ， 所 以 (di 一 ds ) 二 p， 因 此 a 二 cp/(di 一 dz) 且 pp 有 大 于 1 的 公 因 子 。 这 导出 了 了 矛盾， 因为 
a 和 p EERI. Ki, Z 中 的 见证 个 数 一 定 和 Z 中 的 非 见 证 个 数 一 样 多 ， 故 而 至 少 Z8 
中 一 半 的 成 员 是 见证 。 

下 面 证 明 Zy. 中 每 个 不 与 p PROMO RELE., WR OMP AANT, 那么 ， 对 任意 的 
e>0, Ab Mp MEABAATF. Alt, 6° 'Al(mod p). MA, 我们 得 出 结论 ， 至 少 Z 中 
一 半 的 成 员 是 见证 。 
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natural numbers (f AR), 0.2.1, 6.2.1 
real numbers (实数 ) 4.2.1 

nonegative real numbers ( 非 负 实数 ) 7.1.1 
empty set ( 空 集 )，0. 2. 1 

element (元 素 ) 0.2.1 

not element ( 非 元 素 )，0. 2. 1 

subset ( 子 集 )，0. 2. 1 

proper subset (真子 集 )，0. 2. 1 

union operation〈 并 运算 ) 0.2.1, 1.1.5 
intersection operation ( 交 运 算 ) 0.2.1 
Cartesian or cross product ($ F JLÆ È X 
PU, 0 2.2 

empty string (4), 0.2.5 

reverse of w (w 的 反 转 )，0. 2.5 

negation operation ( 非 运算 )，0. 2.6 
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conjunction operation (@Ria#H), 0. 2.6 

disjunction operation ( 析 取 运算 ) 0. 2.6 

exclusive OR operation ( 异 或 运算 ) 0.2.6 

implication operation (蕴涵 运算 )，0. 2. 6 

equality operation ($1424), 0.2.6 

reverse implication (RAW), 0.3 

implication (W), 0.3 

logical equivalence (逻辑 等 价 ) 0.3 

concatenation operation (连接 运算 )，1. 1. 5 

x star operation ( 星 号 运算 ), 1.1.5 

+ plus operation (加 运算 )，1. 3. 1 

P(Q) power set (RÆ), 1.2.1 

>» alphabet (字母 表 ) 1.2.1 

x ZUt{e}〈 带 空 串 的 字母 表 ), 1.2.1 

(*) encoding (编码 ) 3.3.2, 7.2.2 

L blank (47), 3.1.1 

<m Mapping reduction (映射 归 约 )，5. 3. 2 

<r Turing reduction (图 灵 归 约 )，6. 3 

<, log space reduction (对 数 空 间 归 约 )，8.5 

<p polynomial time reduction (多 项 式 时 间 归 
约 )，7. 4.1 
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Th(M) theory of model (模型 的 理论 ) 6.2 
K(x) descriptive complexity (描述 复杂 性 )，6. 4.1 
vy universal quantifier (全 称 量 词 )，8. 3. 1 
q existential quantifier (存在 量词 ) 8.3.1 
A exponentiation (指数 ) 9.1 
OC f(n)) big-O notation (大 OWS), 7.1.1 
o( f(n)) small-o notation (小 o 记 号) 7.1.1 
A 
Accept state (接受 状态 ) 1.1, 1.1.1 
Acceptance problem (接受 问题 ) 
for CFG (上 下 文 无 关 文 法 )，4. 1,2 
for DFA (确定 有 限 自 动机 )，4.1.1 
for LBA (线性 有 界 自 动机 )，5.1 
for NFA ( 非 确定 有 限 目 动机 ),，4. 1.1 
for TM (图 灵机 )，4.2 
Accepting computation history (接受 计算 历史 )，5. 1 
Accepting configuration (接受 格局 ) 3.1.1 
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Hats LLI 
Acre (CFG 接受 的 语言 )，4. 1. 2 
Acyclic graph (无 环 图 )，10. 2. 3 
Apra (DFA 接受 的 语言 )，4. 1. 1 
Adjacency matrix ( 相 邻 矩阵 ) 7.2.2 
Adleman, Leonard M. (人 名 )， 参 考 文 献 
Agrawal, Manindra (人 名 )， 参 考 文 献 
Aho, Alfred V. (人 名 )， 参 考 文献 
Akl, Selim G. 〈 人 名 )， 参 考 文献 
Aiga (LBA 接受 的 语言 ) 5.1 
Algorithm (算法 ) 
complexity analysis (复杂 性 分 析 ) 7.1.1, 7.1.2 
decidability and undecidability (可 判定 性 和 不 可 
判定 性 )， 第 4 章 
defined (ŒX), 3.3 
describing (描述 ) 3.3.2 
Euclidean〈 欧 几 里 得 )，7. 2. 2 
polynomial time (多 项 式 时 间 )，7. 2. 1 
running time (运行 时 间 )，7. 1 
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Alon, Noga (人 名 )， 参 考 文献 
Alphabet, defined (字母 表 ) 0.2.5 
Alternating Turing machine (交错 式 图 灵机 )，10.3 
Alternation (X EA), 10.3 
Ambiguity (歧义 性 )，2. 1.4 
Ambiguous (歧义 的 ) 
NFA ( 非 确 定型 有 穷 自动 机 )， 问 题 4. 19 
grammar (文法 )，2. 1. 4， 问 题 5. 9 
Amplification lemma (加 强 引 理 ) ，10. 2. 1 
AND operation (AND 运算 )，0. 2. 6 
Anra (NFA 接受 的 语言 )，4. 1. 1 
Angluin, Dana (人 名 )， 参 考 文献 
Anti-clique (A HWA), ， 问 题 0. 15 
Approximation algorithm (近似 算法 ) 10.1 
Arex 〈 正 则 文法 接受 的 语言 )，4.1.1 
Argument ( 自 变 量 )，0. 2. 3 
Arithmetization (算术 化 )，10. 4. 3 
Arity (元 数 )，0. 2.3，6.2 
Arora, Sanjeev (人 名 )， 参 考 文献 
ASPACE( f(n)) 〈 交 错 式 空间 复杂 性 )，10. 3. 1 
Asymptotic analysis ( 渐 近 分 析 ) 7.1.1 
Asymptotic notation ( 渐 近 记 法 ) 
big-O notation (大 OWS), 7.1.1 
small-o notation (小 o 记号 ) 7.1.1 
Asymptotic upper bound ( 渐 近 上 界 ) 7.1.1 
ATIME(t(n)) 〈 交 互 式 时 间 复 杂 性 )，10. 3. 1 
Arm (TM 接受 的 语言 ) 4.2 
Atomic formula (原子 公式 )，6.2 
Automata theory (自动 机 理论 ) 0.1.3 
Context-free language (上 下 文 无 关 语 言 ),，2.1 
Regular language (正则 语言 )，2. 1 
Average-case analysis (平均 情况 分 析 ) 7.1 
B 
Baase, Sara (人 名 )， 参 考 文献 
Babai, Laszlo (人 名 )， 参 考 文 献 
Bach, Eric (人 名 )， 参 考 文献 
Balcázar, Josée Luis (人 名 )， 人 参考 文献 
Basis of induction (归纳 基础 )，0. 4. 3 
Beame, Paul W. (人 名 )， 参 考 文献 
Big-O notation (K O 记 号) 7.1.1 
Bijective function (3H wR), 4.2.1 
Binary function (二 元 函数 ) 0. 2.3 
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Binary operation (二 元 运算 ), 1.1.5 
Binary relation (二 元 关系 )，0. 2. 3 
Bipartite graph (二 部 图 )， 问 题 8. 14 
Blank symbol U (空白 符号 ) 3.1.1 
Blum, Manuel (人 名 )， 参 考 文 献 
Boolean circuit (布尔 电 路 ) 9.3 
depth (深度 )，10. 5. 1 
gate (1]), 9.3 
size (FUR), 10.5.1 
uniform family (一 致 族 )，10. 5.1 
wire 〈 导 线 )，9. 3 
Boolean formula (布尔 公式 )，7.4，8. 3.1 
minimal ( 极 小 的 )， 问 题 7.21, 9.2, 10.3.1, 10.3.2 
quantified (量词 化 的 )，8. 3.1 
Boolean logic (布尔 逻辑 ) 0.2.6 
Boolean matrix multiplication (布尔 矩阵 乘法 )，10. 5. 1 
Boolean operation (布尔 运算 )，0.2.6，6.2，7.14 
Boolean variable (布尔 变量 )，7. 4 
Bound variable (约束 变量 )，8. 3. 1 
Branching program (分 支 程 序 ) 10. 2. 3 
read-once 〈 只 读 一 次 的 ) 10.2.3 
Brassard，Gilles (人 名 )， 参 考 文献 
Bratley, Paul (人 名 )， 参 考 文献 
Breadth- first search (宽度 优先 搜索 )，7. 1. 3 
Brute-force search (Æ H 4# R), 7.2.1, 7.2.2, 
Tidy ts tee 
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Cantor, Georg (#6), 4.2.1 
Carmichael number 〈 卡 米 切 尔 数 ) 10. 2. 2 
Carmichael, R. D. (人 名 )， 参 考 文献 
Cartesian product (ff KJL#), 0.2.2, 1.1.5 
CD-ROM, 8. 4 
Certificate (HEF), 7.3 
CFG (上 下 文 无 关 文 法 )， 参 见 Context- free grammar 
CFL (上 下 文 无 关 语 言 )， 参 见 Context- free language 
CAE), 6.4.1 
Chandra，Ashok (人 名 )， 参 考 文 献 
Characteristic sequence (特征 序列 ) 4.2.1 
Checkers, game of (跳棋 ， 一 种 游戏 )，8. 3. 3 
Chernoff bound (JERAR), 10.2.1 
Chess, game of (国际 象棋 )，8. 3. 3 
Chinese remainder theorem (中 国 剩余 定理 )，10. 2. 2 
Chomsky normal form (FF i Hy Æ Ww A), 2.1.5, 
问题 2.38, 4.1.2, 7.2.2 
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CIRCUIT-SAT, 9.3 
Circuit-satisfiability problem 〈 电 路 满足 性 问题 )，9. 3 
CIRCUIT- VALUE, 10.5.3 
Circular definition (循环 定义 )，1. 3.1 
Clause (J), 7.4.1 
Clique (WH), 问题 0.15, 7.3.1 
CLIQUE, % 31 
Closed under (E +=- Fajs llb 
Closure under complementation 〈 在 补 运 算 下 封闭 )， 
context- free language, non- (( 非 ) 上 下 文 无 关 
文法 ) ， 练 习 2. 2 
deterministic context-free languages (确定 型 上 下 
文 无 关 语 言 )，2. 4.1 
P， 练 习 7.6 
regular language (正则 语言 ) ， 练 习 1.14 
Closure under concatenation (在 连接 运算 下 封闭 ) 
context- free language (上 下 文 无 关 语 言 )， 练 
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NP, 练习 7.7 
P, HY 7.6 
regular language (正则 语言 ), 1.1.5, 1.2.3 
Closure under intersection (在 交 运 算 下 封闭 ) 
context- free language, non- (( 非 ) 上 下 文 无 关 
文法 )， 练 习 2.2 
regular language 《正则 语言 ), 1.1.5 
Closure under star (在 星 号 运算 下 封闭 ) 
context- free language (上 下 文 无 关 语 言 )， 练 
3J. 2. 23 
NP, 4&4 7. 43 
P, 练习 7.42 
regular language 〈 正 则 语言 ) 1.2.3 
Closure under union (在 并 运算 下 封闭 ) 
context- free language (上 下 文 无 关 语 言 )， 练 
2.23 
NP, 练习 7.7 
P, %3 7.6 
regular language (正则 语言 ), 1.1.5, 1.2.3 
CNF-formula (CNF yest), 7.4.1 
Co- Turing- recognizable language ( 补 图 灵 可 识别 语 
;= 4.2.3 
Conham, Alan (人 名 )， 参 考 文献 
Coefficient (AM), 3.3.1 
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Complement operation (〈 补 运算 ) 0.2.1 
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ATIME(t(n)), 10.3.1 
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coNL, 8.6 

coONP, 7.3.1 
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IP, 10.4.2 
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NL, 8.4 

NP, 7.3 
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TIME(f(n)), 7.1.2 
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COMPOSITES, 7.3 
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decidability and undecidability (可 判定 性 和 不 可 
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recursion theorem (递归 和 定理) 6.1 
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Turing machine (图 灵机 )， 第 3 章 
Computable function (AJ it pw), 5.3.1 
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context-free language (上 和 下文 无 关 语言 ) 5.1 

defined (ŒX), 5.1 
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Concatenation operation (Œz), 1.1.5, 1.2.3 
Configuration 〈 格 局 ) 3.1.1, 8.4 
Conjunction operation ( 合 取 运算 ) 0. 2.6 
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coNL, 8.6 
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ambiguous (歧义 的 )，2. 1.4， 问 题 5. 9 

defined (ŒX), 2.1.1 
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Cook, Stephen A. (Æ Œ), 7.4, 9.3, 10.5.2, 
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Cook- Levin theorem〈 库 克 - 列 文 定理 ), 7.4.3, 第 8 

mB, 第 9 章 
Cormen, Thomas (人 名 )， 参 考 文献 
Corollary (推论 ) 0.3 
Correspondence (对 应 ) 4.2.1 
Countable set (可 数 集 )，4. 2. 1 
Counterexample (反例 )，0.3 
Counting problem (计数 问题 )，10. 4.3 
Cross product (LÆ), 0.2.2 
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Davis, Martin (4 J + RAE), 3.3.1 
DCFG (确定 型 上 下 文 无 关 文 法 )， 参 见 Determin- 
istic context- free grammar 
Decidability (可 判定 性 )， 参 见 Undecidability 

context-free language (上 下 文 无 关 语 言 )，4. 1. 2 

of Ags 4.1.2 
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Definition (ŒX), 0.3 
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Error probability 《错误 概率 )，10. 2. 1 
FETM， 练 习 4.5 
Erm, undecidability (ETM 不 可 判定 性 )，5. 1 
Euclidean algorithm 〈 欧 几 里 得 算法 ) 7.2.2 
Even, Shimon (人 名 )， 参 考 文献 
EXCLUSIVE OR operation 〈 异 或 运算 ) 0.2.6 
Existential state 〈 存 在 状态 ) 10.3 
Exponential bound (指数 界 ) ，7. 1. 1 
Exponential, versus polynomial (指数 的 ， 相 对 多 
TAH), 7.2.1 
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EXPSPACE- completeness (EXPSPACE 完全 性 ) 9.1 
EXPTIME,, 8.2 
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Fermat test (# Swink), 10. 2.2 
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decidability 〈 可 判定 性 ) 4.1 
defined (定义 见 1.1.1) 
designing (iif), 1.1.4 
transition function (转移 函数 ) 1.1.1 
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FORMULA-GAME,, 8. 3. 2 
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Halting configuration 〈 停 机 格局 ) 3.1.1 
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unsolvability of (不 可 解 性 )，5.1 
HALT m™, 5.1 
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exponential time algorithm (指数 时 间 算 法 )，7.3 
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HAMPATH, 7.3, 7.5.2 
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forced (强制 的 )，2. 4.2 
Harary, Frank (人 名 )， 参 考 文献 
Hartmanis, Juris (人 名 )， 参 考 文献 
Hey, Anthony J.G. (人 名 )， 参 考 文献 
Hierarchy theorem 〈 层 次 定理 ) 9.1 
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time 〈 时 间 )，9. 1 
High-level description of a Turing machine (图 灵机 
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Hofstadter, Douglas R. (人 名 )， 参 考 文献 
Hoover, H. James，( 人 名 )， 参 考 文 献 
Hopcroft, John E. ，( 人 名 )， 参 考 文献 
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Immerman, Neil (人 名 )， 参 考 文献 
Implementation description of a Turing machine 〈 图 
灵机 的 实现 描述 )，3. 3.2 
Implication operation (蕴涵 运算 )，0. 2.6 
Incompleteness theorem (不 完全 性 定理 )，6. 2.2 
Incompressible string (不 可 压缩 的 串 )，6. 4.3 
Indegree of a node ( 结 点 的 入 度 ) 0.2.4 
Independent set (独立 集 )， 问 题 0. 15 
Induction (归纳 法 ) 
basis (基础 )，0. 4. 3 
proof by 《证 明 )，0. 4. 3 
step (步骤 )，0. 4. 3 
Induction hypothesis (归纳 假设 )，0. 4. 3 
Inductive definition (HAM), 1.3.1 
Infinite set (无 穷 集合 )，0. 2.1 
Infix notation (中 缀 表示 法 )，0. 2. 3 
Inherent ambiguity (固有 歧义 性 )，2. 1. 4 
Inherently ambiguous context- free language (固有 
歧义 的 上 下 文 无 关 语 言 )，2. 1.4 
Injective function (#5 pie), 4.2.1 
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Interpretation (解释 )，6.2 

Intersection operation ( 交 运 算 )，0. 2.1 

IP; 10.42 


ISO, 10.4.1 

Isomorphic graphs ( 同 构 图 )， 练 习 7.12 
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k-ary function (k 元 函数 ) 0.2.3 
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Ladder (梯子 )， 问 题 8. 25 
Language (语言 ) 
co-Turing-recognizable ( 补 图 灵 识 别 的 )，4. 2. 3 
context-free (上下文 无 关 的 )，2. 1 
decidable (可 判定 的 )，3.1.1 
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Lichtenstein, David (人 名 )， 参 考 文献 
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LISP» 3« 2.4 
Literal (XF), 7.4.1 
Log space computable function (对 数 空间 可 计算 限 
RI), 8.5 
Log space reduction 〈 对 数 空 间 归 约 )，8.5 
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Mapping reducibility (映射 可 归 约 性 ) 5.3 
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Model (模型 ) 6.2 
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Modulo operation ( 模 运 算 )，0. 2. 3 
Motwani, Rajeev (人 名 )， 参 考 文献 
Multiset (SERS), 0.2.1, 7.3.1 
Multitape Turing machine (BHA RAL), 3.2.1 
Myhill-Nerode theorem (Myhill-Nerode 定理 )， 问 
题 1. 48 
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NG; 10,5. 2 
Negation operation ( 非 运算 )，0. 2.6 
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unordered 《二 元 集合 )。 0.2.1 
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simple (简单 的 ) 0.2.4 
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Post Correspondence Problem (PCP， 波 斯 特 对 应 
问题 )，5. 2 
modified (修正 的 )，5.2 


Papadimitriou, Christors H. 


Power set (##@), 0.2.2, 1.2.1 
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FORMULA-GAME , 8. 3. 2 
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PSPACE-completeness (PSPACE 完全 性 ) 8.3 
defined (ŒX), 8.3 
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defined (ŒX), 2.2.1 
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schematic of (RÆ), 2.2 
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Ramsey’s theorem (Ramsey 定理 )， 问 题 0.15 
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FF), 10.2.3 
Real number (实数 ) 4.2.1 
Recognizes a language, meaning of (识别 语言 ， 意 思 
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Reducing string (上 归 约 串 )，2. 4. 2 
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Turing (图 灵 )，6.3 
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Regular expression (正则 表达 式 )，1. 3 
defined (ŒX), 1.3.1 
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defined 〈 和 定义 )，1.1. 3 
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Robinson, Julia, 3.3.1 
Roche, Emmanuel (人 名 )， 参 考 文献 
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S 
SAT, 7.4.35 8.2 
# SAT, 10.4.3 
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Savitch’s theorem ( 萨 维 奇 定理 )，8. 1 
Saxena, Nitin (人 名 )， 参 考 文 献 
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Space complexity of nondeterministic Turing machine 
( 非 确 定型 图 灵机 的 空间 复杂 性 )， 第 8 章 

Space constructible function (43 [a] A] Faz pei), 9.1 

Space hierarchy theorem (空间 层次 理论 ) 9.1 

Spencer, Joel H. (AZ), BY MM 

Stack (k), 2.2 

Star operation (#5Siz#), 1.1.5, 1.2.3, [alg 7. 42 

Start configuration (起 始 格 局 ) 3.1.1 

Start state (起 始 状 态 ) 1.1 

Start variable, in a context-free grammar (在 上 下 
文 无 关 文 法 中 的 开始 变 元 )，2.1，2. 1.1 

State diagram (状态 图 ) 
finite automaton (有 穷 自 动机 的 )，1.1 
pushdown automaton (下 推 自 动机 的 ) 2.2.2 
Turing machine (图 灵机 的 )，3. 1. 2 


Stearns, Richard E. (人 名 )， 参 考 文献 

Steiglitz, Kenneth (人 名 )， 参 考 文献 

(人 名 )， 参 考 文献 

String (FF), 0.2.5 

String order (FF BMF), 0.2.5 

Strongly connected graph (5% 7 Ñ AI), 0.2.4, [A] 
fel 8. 16 

Structure (4944), 6.2 

Subgraph (FI), 0.2.4 

Subset of a set (集合 的 子 集 )，0. 2. 1 

SUBSE TI-SUMsy 7.3.15 7.5.3 

Substitution rule (替换 规则 )，2. 1 

Substring (#8), 0.2.5 

Sudan, Madhu (人 名 )， 参 考 文献 

Surjective function 〈 满 映射 ) 4.2.1 

Symmetric difference (对 称 差 )，4. 1. 1 

Symmetric relation (对 称 关 系 )，0. 2. 3 

Synchronizing sequence (同步 序列 )， 问 题 1. 66 

Szegedy, Mario (人 名 )， 参 考 文献 

Szelepczényi, Robert (人 名 )， 参 考 文 献 

T 


Stinson, Douglas R. 


Tableau (Hj mi), 9.3 
Tarjan, Robert E. (人 名 ， 见 参考 文献 ) 
Tautology ( 永 真 式 )，10. 3. 1 
Term, ina polynomial (多 项 式 中 的 项 )，3.3.1 
Terminal (终结 符 )，2.1 
Terminal in a context-free grammar (上 下 文 无 关 文 
法 中 的 终结 符 )，2. 1.1 
Th(M), 6.2 
Theorem (ŒM), 0.3 
Theory，of a model (模型 的 理论 ) ，6. 2 
3COLOR, ， 问 题 7. 38 
S5AT, 7.4.16 2.2 
Tic-tac-toe, game of (一 种 儿童 游戏 )， 练 习 8.2 
TIME(C f(n)), 7.1. 2 
Time complexity (时 间 复 杂 性 )，7 
analysis of (的 分 析 ) ，7. 1. 1 一 7. 1. 2 
of nondeterministic Turing machine ( 非 确 定型 图 
灵机 的 )，7. 1. 3 
Time complexity class (时 间 复 杂 性 类 )，7. 1. 2 
Time constructible function (时 间 可 构造 限 数 )，9.1 
Time hierarchy theorem (时 间 层 次 定理 )，9.1 
TM, ÁJ Turing machine 
TQBF, 8.3.1 


Transducer (转换 器 ) 
finite state A F RER), KI 1. 24 
log space (对 数 空间 的 )，8.5 
Transition (转移 )，1.1 
Transition function (转移 图 数 ) 1.1.1 
Transitive closure (传递 闭 包 ) 10.5.1 
Transitive relation (传递 关系 )，0. 2. 3 
Trapdoor function (RA HA), 10.6.4 
Tree (ff), 0.2.4 
leaf (F), 0.2.4 
parse 〈 语 法 分 析 ) 2.1 
root 〈( 根 )，0. 2. 4 
Triangle in a graph (图 中 的 三 角形 )， 练习 7. 9 
Tuple (元 组 )，0. 2. 2 
Turing machine 〈 图 灵机 )，3.1，3. 2 
alternating (交错 的 ) 10.3 
comparison with finite automaton 〈 与 有 穷 自 动机 对 
| 
defined (#2), 3.1.1 
describing (描述 ) 3.3.2 
examples of (Æj), 3.1.2 
marking tape symbols (标记 带 符号 ) 3.1.2 
multitape 〈 多 带 的 ) 3.2.1 
nondeterministic 〈 非 确定 型 的 )，3. 2. 2 
oracle ( 论 示 )，6.3，9. 2 
schematic of (示意 性 的 )，3.1 
universal (通用 的 )，4.2 
Turing reducibility (图 灵 可 归 约 性 )，6.3 
Turing, Alan M. ( 阿 伦 - BR), 0.1.2, 3.1, 
3.3.1, BSR 
Turing-decidable language 〈 图 灵 可 判定 性 语言 )， 
Be ded 
Turing-recognizable language (图 灵 可 识别 语言 )， 
ae oa I 
Turing-unrecognizable language (图 灵 不 可 识别 语 
CIE N E 
Ear 5.3.2 
Two-dimensional finite automaton (— #4 FAW 
机 )， 问 题 5.15 
Two-headed finite automaton (二 头 有 穷 自 动机 )， 
问题 5. 14 
2DFA， 参 见 Two-headed finite automaton) 
2DIM-DFA, #3 Two-dimensional finite automaton) 
2SAT, [alm 7. 24 


K žl 295 


U 
Ullman, Jeffrey D. (人 名 )， 参 考 文献 
Unary (一 元 的 ) 
alphabet (字母 表 ) ，1. 2. 1，1. 4， 问 题 5. 33 
function (pax), 0.2.3 
notation 《标记 )，7. 2. 2， 问 题 7. 44 
operation (运算 ), 1.1.5 
Uncountable set (不 可 数 集 )，4. 2. 1 
Undecidability (不 可 判定 性 ) 
diagonalization method (对 角 化 方法 )，4. 2. 1 
of Arm, 4.2.1 
of Eppa, 5.1 
of EQrm, 5.1 
of Erm, 5.1 
of HALT ry, 5.1 
of REGULAR, 5.1 
of EQcrc, 4.1.2 
of Post correspondence problem (波斯 特 对 应 问 
题 的 )，5. 2 
via computation histories (利用 计算 历史 的 )， 
a | 
Undirected graph (无 向 图 )，0. 2.4 
Union operation (并 运算 )，0.2.1s 1.1.5, 1.2.3 
Unit rule (单一 规则 )，2. 1. 5 
Universal quantifier (全 称 量词 ) 8.3.1 
Universal state (全 称 状 态 ) 10.3 
Universal Turing machine (通用 图 灵机 )，4. 2 
Universe (〈 论 域 ) 6.2, 8.3.1 
Unordered pair (二 元 集合 ) 0.2.1 
Useless state (无 用 状态 ) 
in PDA， 问 题 4.18 
in TM， 问 题 5. 29 
V 
Valiant, Leslie G. (AZ), BBM 
Valid string (有 效 串 ) 2.4.2 
Variable (变量 ， 变 元 ) 
Boolean (布尔 )，7.4 
bound (约束 )，8. 3. 1 
in a context-free grammar (在 上 下 文 无 关 文 法 中 
的 )， 第 2 章 ，2.1.1 
start (#26), 2.1, 2.1.1 
Venn diagram (XRK), 0.2.1 
Verifier (验证 机 )，7.3，10. 4. 2 
Vertex of graph (图 的 项 点 )，0. 2. 4 


296 Æ ?| 


VERTEX-COVER, 7.5.1 

Virus (Ri), 6.1. 3 

Vitanyi, Paul (AZ), 2# XKR 

W 

Wegman, Mark (AZ), BY xR 
Well-formed formula (和 良 构 公式 )，6. 2 
Williamson, David P. 〈 人 名 )， 参 考 文献 
Window, ina tableau (画面 中 的 窗口 ) 7.4.3 
Winning strategy ( 必 胜 策 略 )，8. 3. 2 
Wire in a Boolean circuit (布尔 电路 的 导线 )，9. 3 
Worst-case analysis (最 坏 情 况 分 析 ) 7.1 


X 
XOR operation (# RZA), 0.2.6, 9.3 
Y 
Yannakakis, Mihalis (AZ), BY we 
Yields (产生 ) 
for configurations (格局 )，3. 1.1 
for context-free grammars (上 下 文 无 关 文 法 )， 
| 


ZPP， 问 题 10. 10 
Zuckerman, Herbert S，( 人 名 )， 参 考 文献 


ro~- 


—~“a 


BY WTA at 





{E#: Abraham Silberschatz 著 作者 : Jiawei Han 等 著 作者 : lan H.Witten 等 著 
ch yr EMR. 978-7-111-37529-6, 99.007 中 文 版 ，978-7-111-39140-1，79.00 元 中 文 版 ，978-7-111-45381-9，79.00 元 
本 科教 学 版 ，978-7-111-40085-1，59.00 元 





作者 : Randal E. Bryant 等 著 作者 : David A. Patterson John L. Hennessy 作者 : James F. Kurose # 
#8. 978-7-111-32133-0, 99.00% 中 文 版 978-7-111-50482-5. 99.007 书号 : 978-7-111-45378-9，79.00 元 


at. 
ING fh 


vivo 


PROGRAMMI 
wy 


BEAM W REPS AN 
Peers aria 
~ 


~ 





作者 ，Thomas H. Cormen 等 著 作者 :Brian W. Kernighan 等 著 作者 : Roger S. Pressman # 
#8. 978-7-111-40701-0，128.00 元 #2. 978-7-111-12806-0. 30.005 #8. 978-7-111-33581-8. 79.007 


推荐 阅读 - 


和 数据 分析 


统计 学 导 导 论 








大 数 所 分析: 数据 哎 动 的 企业 绩效 优化、 过 程 管理 和 运营 入 ”统计 学 习 导 论 一 一 基于 R 应 用 


作者 : Thomas H. Davenport ISBN: 978-7-111-49184-2 定价 : 59.00 元 作者: 加 雷 斯 . 詹姆斯 等 ISBN: 978-7-111-49771-4 定价 79.00 元 


PRPA GRIN 


\ AJ 





商务 智能 : 数据 分 析 的 管理 视角 ( 原 书 第 3 版 ) 


作者 : 拉 姆 什 , 沙 尔 达 等 ISBN: 978-7-111-49439-3 定价 : 69.00 元 





购书 热线 : (010) 68326294 88379649 68995259 数字 阅读 : www.hzmedia.com.cn 





计算 理论 导 引 accom 


Introduction to the Theory of Computation Third Edition 


本 书 由 计算 理论 领域 的 知名 权威 Michael Sipser 所 撰写 。 他 以 独特 的 视角 ， 系 统 地 介绍 了 计算 理论 的 三 
个 主要 内 容 : 自动 机 与 语言 、 可 计算 性 理论 和 计算 复杂 性 理论 。 绝 大 部 分 内 容 是 基本 的 ， 同 时 对 可 计算 性 
和 计算 复杂 性 理论 中 的 某 些 高 级 内 容 进 行 了 重点 介绍 。 作 者 以 清新 的 笔触 、 生 动 的 语言 给 出 了 宽泛 的 数学 
原理 ， 而 没有 拘泥 于 某 些 低 层次 的 细节 。 在 证 明之 前 ， 均 有 “证 明 思 路 ”， 帮 助 读 者 理解 数学 形式 下 强 胡 
的 概念 。 同 样 ， 对 于 算法 描述 ， 均 以 直观 的 文字 而 非 伪 代码 给 出 ， 从 而 将 注意 力 集中 于 算法 本 身 ， 而 不 是 
某 些 模型 。 新 版 根据 多 年 来 使 用 本 书 的 教师 和 学 生 的 建议 进行 了 改进 ， 并 用 一 节 的 篇 幅 对 确定 型 上 下 文 无 
关 语 言 进行 了 直观 而 不 失 严 谨 的 介绍 。 此 外 ， 对 练习 和 问题 进行 了 全 面 更 新 ， 每 章 末 均 有 习题 选 答 。 


迈克 尔 . 西 普 塞 ( Michael Sipser) 美国 麻 省 理工 学 院 应 用 数学 系 教 授 ， 计 算 机 科学 和 
智能 实验 室 (CSAIL) 成 员 。 他 从 事理 论 计 算 机 科学 与 其 他 数学 课程 的 教学 工作 三 十 多 
E Beene, 他 痴迷 于 复杂 性 理论 ， 喜 欢 复杂 性 理论 的 教学 工作 。 





i 


AA 


上 架 指导 : 计算 机 \ 计 算 理 论 





ISBN 978-7-111-49971-8 
e'e CENGAGE 
= Learnin g 
www.cengageasia.com 
投稿 热线 : (010) 88379604 华章 网 站 : www.hzbook.com 
客服 热线 : (010) 88378991 88361066 网 上 购书 : www.china-pub.com 87111"49971 





O R e a ca 69.00% 


